nutch1.3同1.2部署大同小异,附件中会有我上传的文件源码,直接在myeclipse中import--->exisits project into workspace
工程直接部署成功了,
然后需要进行简单的配置
1,debug---open debug dialog
2,java application--->new
3,main菜单
project:nutch1.3
main class:org.apache.nutch.crawl.Crawl
arguments菜单
program arguments:crawl urls -dir crawl -depth 1 -topN 50
vm arguments:-Dhadoop.log.dir=logs -Dhadoop.log.file=hadoop.log
common菜单
选择dubug或者run,然后apply,然后再run就ok,看console应该会有日志打印出来了。
4,如果碰到异常可以看下我前几篇文章有我碰到的异常及解决方法
注:源码是不带lib下的jar包的,自己把nutch1.3jar 包下载下来导入吧。
开发工程包下载路径:
http://download.csdn.net/detail/a221133/3740268