
爬虫
文章平均质量分 62
梦染(°ー°〃)星尘
这个作者很懒,什么都没留下…
展开
-
线程池+jsoup+htmlclient实现微博超话社区自动签到
java线程池+jsoup+htmlunit实现微博超话社区自动签到这是个半夜闲没事写的一个爬虫,所以很多命名可能有点不大好,哈哈,请见谅,程序能运行就行????毕竟也只是闲没事摸个鱼写写的,其实里面也有很多东西可以优化的,不过。。。。。。大半夜的,优化个球球,运行完赶紧睡觉去喽还有一点忘记说了,其实里面只需要用到 java线程池 + jsoup就可以了,只不过以为可能需要用到htmlunit所以才搞上这玩意的先上个线程池工具类:/** * 线程池工具类 */public class Pool原创 2021-07-12 14:26:23 · 1265 阅读 · 2 评论 -
Jsoup线程池分页爬取IP
Jsoup线程池分页爬取IP爬取目标:免费代理ip_服务器http代理_最新ip代理_免费ip提取网站_国内外代理_66免费代理ip (66ip.cn)准备好创建线程池 和 IP对象解析页面获取数据,并将数据存入到集合中遍历测试IP是否可用通过ObjectOutputStream将ip存集合作为对象存入到文件中通过ObjectInputStream读取ip集合对象文件1、准备好创建连接池工具类 和 IP对象(不用这个线程池也无所谓)线程池:/** * 线程池工具类 */publi原创 2021-05-27 00:00:47 · 315 阅读 · 0 评论 -
java分页爬取站长素材的图片
JSON爬虫站长素材图片小案例:**目标:[爬取 地球图片、地球图片大全_站长素材 (chinaz.com)](https://sc.chinaz.com/tupian/diqiutupian.html) 这个网页的图片**但是如何爬取该分类的所有图片呢?算了,入门案例懒得敲笔记了,自己看下面代码去。注释上面有![在这里插入图片描述](https://img-blog.csdnimg.cn/20210521102010187.png?x-oss-process=image/watermark,typ原创 2021-05-21 10:28:10 · 298 阅读 · 2 评论