爬虫
文章平均质量分 92
th是个小屁孩
这个作者很懒,什么都没留下…
展开
-
HttpUnit模拟按钮点击以及爬虫实现
HttpUnit 简介 HttpUnit 本质上相当于一个后台的透明的浏览器引擎,使用java中的HttpUnit可以实现模拟点击按钮,抓取网页元素,实现动态爬虫,之前一直使用jsoup进行爬虫,不过这次爬取一个生物论坛时候,需要动态处理,发现了httpUnit这个好的框架。HttpUnit demo1.几行代码实现获取网页源代码。final WebClient webClient=new Web原创 2016-10-29 22:10:47 · 18670 阅读 · 8 评论 -
爬虫抓取网易云音乐民谣歌单,收听量排行
今天花了一点时间抓取了网易云音乐的热门民谣歌单,共1500热门民谣歌单,后续有时间会爬取其他分类。文末有源代码下载。下面记录一下过程。原创 2016-12-12 16:11:34 · 6130 阅读 · 1 评论