自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 JAVA中的集合框架

Java中的集合框架是指一系列存储数据的接口和类,这些类和接口都位于java.util包中 使用集合框架可以解决复杂的数据存储问题,Java中内置了丰富的集合框架 Collection是一种数据结构,是集合的最大接口 List接口的定义:存储顺序有序,可以保存重复元素 List接口的常用子类有:ArrayList和Vector LinkedList中的存放元素按照先进先出方式

2017-12-27 19:48:04 217

原创 JAVA爬虫抓取百度指数思路总结

做了一个多月的JAVA爬虫爬取百度指数的项目,发现出现了很多问题,总结如下: 抓取百度指数的整体思路:   1、首先得模拟登陆百度账号(用selenium+PhantomJS模拟登陆百度,获取cookie)  2、由于有该死的验证码,因此我们要绕过验证码,保存cookie模拟登陆(绕过万恶的验证码)  3、然后模拟登陆以后,程序截取屏幕保存到本地图片。(屏幕截屏)  4、读取本

2017-12-27 19:29:14 1010 1

原创 爬虫抓取百度指数思路总结

百度指数抓取思路   浏览器截图+OCR识别,因为百度指数的数值是采用html格式+加密二进制传输,怎么都是需要OCR的。   浏览器截图:截取百度指数位置的子图片,截整个页面的图比较容易,要获取指数所在的span的位置,直接调用html的元素的getSize和getLocation返回都是0,简单粗暴地用硬编码了。   OCR的时候,调用tesseract,识别数字,不需要安装额外的

2017-12-20 10:20:40 11519

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除