基于webmagic的java网页爬虫,抓取网页指定节点,然后使用dom4j分析xml数据
1、webmagic是一个非常好用的网页爬虫,功能丰富,强悍,可以按照jquery类似的css选择器,选择节点,也可以按照xpath抓取指定节点。抓取数据后,可以分析数据。
更详细的请看官方网站,传送门:http://git.oschina.net/flashsword20/webmagic
2、下面给出一个具体的实例,可以直接运行哦。
import java.io.ByteArrayInp
原创
2014-03-06 10:59:51 ·
5879 阅读 ·
1 评论