nutch
neo_2011
知识需要积累……
展开
-
Nutch 插件系统浅析
原文地址:http://www.ibm.com/developerworks/cn/java/j-lo-nutchplugin/?S_TACT=105AGX52&S_CMP=tec-csdn Nutch 基本情况 Nutch 是 Apache 基金会的一个开源项目,它原本是开源文件索引框架 Lucene 项目的一个子项目,后来渐渐发展成长为一个独立的开源项目。它基于 Java 开发转载 2011-11-14 16:40:42 · 1015 阅读 · 0 评论 -
nutch-1.2和nutch-1.3的配置使用
一年多以前简单试用过nutch,但半途而废,打算再次学习一下。 前几天先去nutch官网下了最新的nutch-1.3版,依照wiki说明,在windows+cygwin+eclipse中完成配置。 http://wiki.apache.org/nutch/RunNutchInEclipse(对应nutch-1.3) http://wiki.apache.org/nutch/NutchTuto原创 2011-10-25 13:09:38 · 2760 阅读 · 2 评论 -
Nutch中MapReduce的分析
How Map and Reduce operations are actually carried out http://wiki.apache.org/nutch/MapReduce http://wiki.apache.org/hadoop/MapReduce 转载地址:http://blog.csdn.net/jiutao_tang/article/details/653转载 2011-11-14 16:38:49 · 1568 阅读 · 0 评论 -
WinXP+cygwin+eclipse配置nutch-1.2,添加IKAnalyzer中文分词
主要参考博客: 配置: 1,win7下cygwin + Eclipse + Nutch1.2 + Tomcat6 安装配置 2,nutch1.1导入eclipse中运行 3,nutch研究—基本使用相关说明 添加中文分词包: 4,Nutch1.2 添加IKAnalyzer中文分词 5,nutch研究—遇到的错误和解决办法 6,Nutch1.2二次开发详细攻略(四)【图文】---原创 2011-11-07 17:01:01 · 4688 阅读 · 2 评论