准备:hadoop单机模式设置,参考:http://peigang.iteye.com/admin/blogs/2093070
nutch配置:
1、解压nutch文件,此处以apache-nutch-1.4-bin.tar.gz为例。
2、将编译好的nutch文件拷贝到nutch/runtime/local 目录下。注意lib下的.jar文件必须与编译环境的同步。同时将apache-nutch-*.jar拷贝到lib中。
配置conf目录,将hadoop/conf下的core-site.xml 、hdfs-site.xml、mapred-site.xml拷贝到local/conf下。
运行 nutch/runtime/local/nutch测试是否配置完整