bin/nutch crawl错误解决办法

在尝试使用Nutch进行网络爬虫时遇到了'bin/nutch crawl'命令已弃用的问题,错误提示建议使用'bin/crawl'。官方文档指出,Nutch 1.8及更高版本不再支持'bin/nutch crawl'。通过执行'bin/crawl'并理解其参数,如-urlDir, -solr, -dir等,可以设置爬取任务。此外,文章提到了'bin/nutch'命令用于运行单个Nutch类,而在较新版本中推荐使用'bin/crawl'脚本来进行完整的爬取流程。" 124594355,12478873,Redis键操作详解:设置、过期时间及常用命令,"['Redis', '键管理', '数据过期', '数据操作']
摘要由CSDN通过智能技术生成

看Nutch的搭建问题,以前一直是网上找资料,后来人说,想要成为一个优秀的构架师需要学会主动学习,也就是看帮助文档,所以我也开始学着看NutchTutrial。照着他的步骤来竟然遇到一个错误,想不通啊。

错误信息:Command crawl is deprecated, please use bin/crawl instead

后来在网上找了一下资料,说是官网上说的,1.8和2.2版本之后的Nutch不再支持bin/nutch crawl命令,而改用bin/crawl来使用。一下是别人的解决方案,我也还没试,明天再看。

(版本是个操蛋的问题,自己的学习能力也好不够,官网上已经有说的自己也没去看)

----------------------分割线--------------------------

上面的问题今天早上起来看了一下,基本算是解决了

1.直接执行bin/crawl 然后系统会出现个提示

 Usage:crawl  <seedDir>  <crawlDir>  <solrURL>  <numberOfRounds>
  参数说明 :seedDir:种子url的目录地址
  crawlDir:保存爬取文件的目录
  solrURL:solr的地址(没有则为空)
2.根据这个,用的一个命令,系统开始执行起来。
  bin/crawl urls/seed.txt cr
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值