Nutch配置全过程

Nutch配置全过程

安装各软件,并设置环境变量.
辅助软件1:cygwin的安装见上篇文章,cygwin基础入门,我安装在了e:\cygwin.安装后在桌面有个快截方式.
辅助软件2:jdk安装在C:\Program Files\Java\jdk1.5.0,所以环境变量设置成为JAVA_HOME=C:\Program Files\Java\jdk1.5.0
辅助软件3:tomcat安装在e:\tomcat 6.0
nutch不用安装,是个应用程序,下载后为nutch-0.9.tar.gz,双击桌面上的cygwin快捷方式;执行以下命令:
$ cd D:/Downloads/Soft
$ tar zxvf nutch-1.0.tar.gz
在e盘下面出现nutch-0.9文件夹说明解压成功了.然后环境变量设置为NUTCH_JAVA_HOME=C:\Program Files\Java\jdk1.5.0(也就是说跟JAVA_HOME是相同的).测试nutch是否安装成功,只需要执行以下命令:
$cd D:/Downloads/Soft/nutch-1.0/bin
$sh nutch
出现下面的字样就是安装成功了.
Usage: nutch COMMAND
where COMMAND is one of:
crawl one-step crawler for intranets
admin database administration, including creation
inject inject new urls into the database
generate generate new segments to fetch
fetchlist print the fetchlist of a segment
fetch fetch a segment's pages
dump dump a segment's pages
index run the indexer on a segment's fetcher output
merge merge several segment indexes
dedup remove duplicates from a set of segment indexes
updatedb update database from a segment's fetcher output
mergesegs merge multiple segments into a single segment
readdb examine arbitrary fields of the database
analyze adjust database link-analysis scoring
server run a search server
or
CLASSNAME run the class named CLASSNAME
Most commands print help when invoked w/o parameters.
#
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值