- 博客(7)
- 收藏
- 关注
原创 Python爬虫拉勾网--以北京地区数据分析为例
拉勾作为典型的互联网公司,其数据内容或其形式的所需性,常常成为很多爬虫新手或数据分析职位的人练习爬虫的目标网站。也是由于其目标靶向性太强,拉勾经过重重改版变的愈加难爬。对于新手的我,真的是踩过了所有的坑,才能上岸啊。回头看看,其实也不过是反爬机制太强,我们只要做好反反爬就好了。目标网站数据原理-拉勾网 数据解析 数据爬取 总结目标网站数据存储原理-拉勾网爬取网络数据一定首先要清楚其...
2019-05-20 16:02:39 432
原创 爬取拉勾网终于成功---期间遇见的各类问题大汇总
初入爬虫一行的学习,对爬虫有了简单的了解,一直都想试试拉勾网,但是频频被拒,拉勾的反爬简直太强了。天下没有不透风的墙,查找了各种文献,看了各种帖子,终于克服了一个又一个的难题。下面我们来总结一下,以备今后引以为戒。Problem 1:'status': False, 'msg': '您操作太频繁,请稍后再访问', 'clientIp': '117.136.41.41', 'state': 24...
2019-05-09 18:04:36 5002 4
原创 Jsp四种内置对象的属性范围
学习javaweb开发jsp的学习是基础,而且jsp四种内置对象的属性范围是整个web开发的核心操作,规定了属性的有效范围,为了方便以后的记忆和查询对于其属性范围作了以下饿总结。应该有不规范或者不够全面的地方,希望大家大家谅解,并给予修正和补充。PageContext:只能保存在一个页面,其可以直接操作四种属性范围。Request:只是局限于同一个请求期间,即:如果要在服务器跳转之
2012-04-21 17:27:02 880
原创 Mysql 外键约束
1、 在建表时建立外键 create table A( Aid int primary key,...) create table B( Bid int primary key, Aid int, ... ... foreign key (Aid) references A (Aid) on delete ... on update ... )2. 对已有的表增加
2012-04-11 16:48:46 349
原创 servlet页面跳转问题
在sevlet中Redirect和forword两种方式的区别1) redirect 方式 response.sendRedirect("/a.jsp"); 页面的路径是相对路径。sendRedirect可以将页面跳转到任何页面,不一定局限于本web应用中,如:response.sendRedirect("URL"); 跳转后浏览器地址栏变化。这种方式要传值出去的话,
2012-04-07 10:39:40 779 1
原创 java 连接sqlserver
sql server 默认端口号:1433。选择合适的驱动jdbc配置eg.driver = com.microsoft.sqlserver.jdbc.SQLServerDriverurl = jdbc:sqlserver://localhost:1433;databaseName=你的数据库名字;user = sapassword =
2012-03-27 09:48:06 394
原创 严重: IOException while loading persisted sessions: java.io.EOFException
tomcat在启动时出现如下异常问题: 严重: IOException while loading persisted sessions: java.io.EOFException 严重: Exception loading sessions from persistent storage 分析:EOFException表示输入过程中意
2012-02-23 23:28:15 541
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人