Java开源爬虫框架WebCollector—爬取新浪微博
本教程给出了一个使用WebCollector模拟登陆并爬取新浪微博的示例.登录过程中会出现验证码.如图所示:
1.依赖jar包:
本教程需要两套jar包,WebCollector核心jar包和selenium的jar包。
WebCollector最新jar包可在WebCollector github主页下载。
selenium的maven依赖:<dependency>
<grou
原创
2017-03-26 23:46:34 ·
9099 阅读 ·
5 评论