Nutch运行
文章平均质量分 77
大叔安小巷
我对这个头像比较满意
展开
-
Nutch1.7的deploy模式在伪分布式环境上报错
1.操作系统CentOS 6.5 x64 2.Hadoop平台为Cloudera CDH5 beta2,hadoop-2.2.0 3.开始操作: Nutch1.7已经编译成功,把seed.txt上传到HDFS的urls目录中,目标目录crawl不存在; 在runtime/deploy下执行 hadoop jar apache-nutch-1.7.job org.原创 2014-02-13 17:35:06 · 883 阅读 · 1 评论 -
NUTCH的分布式部署与运行
保留转载法律声明。 部分内容来自于nutch wiki的网络翻译。 本文只有安装、编译、部署和运行,没有debug相关信息。 1. ant的安装 ant是一个基于JAVA的自动化脚本引擎,脚本格式为XML。除了做JAVA编译相关任务外,ANT还可以通过插件实现很多应用的调用。 ANT的基本概念:Java的Makefile 当一个代码项目大了以后,每次重新编译,打包,测试等都原创 2014-02-13 17:09:08 · 1918 阅读 · 1 评论