推荐十个优秀的Java开源爬虫

本文推荐了十个优秀的Java开源爬虫框架,包括WebCollector、YayCrawler、WebMagic、Anthelion、Nutch、Spiderman、GECCO、WebPasser、SeimiCrawler和NEOCrawler。这些框架各具特色,涵盖了从简单到复杂,从轻量级到分布式爬虫的多种需求,适合开发者进行二次开发和快速构建爬虫项目。
摘要由CSDN通过智能技术生成

 

1:JAVA爬虫WebCollector Star:1345

下载地址:http://www.17ky.net/soft/9278.html

爬虫简介: WebCollector是一个无须配置、便于二次开发的JAVA爬虫框架(内核),它提供精简的的API,只需少量代码即可实现一个功能强大的爬虫。WebCollector-Hadoop是WebCollector的Hadoop版本,支持分布式爬取。 爬虫内核: WebCollector致...

2:开源通用爬虫框架YayCrawler Star:91

下载地址:http://www.17ky.net/soft/578.html

YayCrawler是一个基于WebMagic开发的分布式通用爬虫框架,开发语言是Java。我们知道目前爬虫框架很多,有简单的,也有复杂的,有轻 量型的,也有重量型的

3:垂直爬虫WebMagic Star:1213

下载地址:http://www.17ky.net/soft/9284.html

webmagic

  • 2
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值