1:JAVA爬虫WebCollector Star:1345
下载地址:http://www.17ky.net/soft/9278.html
爬虫简介: WebCollector是一个无须配置、便于二次开发的JAVA爬虫框架(内核),它提供精简的的API,只需少量代码即可实现一个功能强大的爬虫。WebCollector-Hadoop是WebCollector的Hadoop版本,支持分布式爬取。 爬虫内核: WebCollector致...
2:开源通用爬虫框架YayCrawler Star:91
下载地址:http://www.17ky.net/soft/578.html
YayCrawler是一个基于WebMagic开发的分布式通用爬虫框架,开发语言是Java。我们知道目前爬虫框架很多,有简单的,也有复杂的,有轻 量型的,也有重量型的
3:垂直爬虫WebMagic Star:1213
下载地址:http://www.17ky.net/soft/9284.html
webmagic