自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 资源 (4)
  • 问答 (1)
  • 收藏
  • 关注

原创 反爬虫策略总结

今日终于有点时间了,总结一下网络爬虫领域比较常见的反爬虫策略,希望在我们抓取数据过程中遇到问题时,提供解决方法。话不多说,开讲:1、最为经典的反爬虫策略当属“验证码”了。因为验证码是图片,用户登录时只需输入一次便可登录成功,而我们程序抓取数据过程中,需要不断的登录,比如我们需要抓取1000个用户的个人信息,则需要填1000次验证码,而手动输入验证码是不现实的,所以验证码的出现曾经难倒了很多网络

2017-06-29 21:10:33 13037 2

原创 异常问题解决方案(SSLProtocolException)

BUG描述:    1、代码在本地开发环境正常,但上传到了服务器端后,启动tomcat就报错;    2、使用httpclient抓取https数据,不加代理没问题,加代理之后就报错;解决方案:        1、在服务器端保证jdk版本是1.6    2、如果是Tomcat程序:在catalina.sh加上JAVA_OPTS="$JAVA_OPTS -Djsse.enab

2017-06-29 20:12:25 8205

mysql5.6安装包linux版

mysql5.6安装包,linux版,有需要的同学可以下载!

2018-11-21

Jcseg汉语分词工具

Jcseg是一个开源的汉语分词工具,由java语言开发,准确率高达百分之九十八,本程序无需配置,可以直接运行,谢谢!

2015-07-13

BASE64.jar

BASE64是一个java开发的加密工具包,主要对普通字符串加密

2015-07-13

最新新浪微博爬虫程序Java版 2015

该爬虫属于本人2015新作,虽然尚有不足,却具有爬虫的基本雏形,望借鉴

2015-03-27

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除