nutch
neo_2011
知识需要积累……
展开
-
Nutch 插件系统浅析
原文地址:http://www.ibm.com/developerworks/cn/java/j-lo-nutchplugin/?S_TACT=105AGX52&S_CMP=tec-csdnNutch 基本情况Nutch 是 Apache 基金会的一个开源项目,它原本是开源文件索引框架 Lucene 项目的一个子项目,后来渐渐发展成长为一个独立的开源项目。它基于 Java 开发转载 2011-11-14 16:40:42 · 1035 阅读 · 0 评论 -
nutch-1.2和nutch-1.3的配置使用
一年多以前简单试用过nutch,但半途而废,打算再次学习一下。前几天先去nutch官网下了最新的nutch-1.3版,依照wiki说明,在windows+cygwin+eclipse中完成配置。http://wiki.apache.org/nutch/RunNutchInEclipse(对应nutch-1.3)http://wiki.apache.org/nutch/NutchTuto原创 2011-10-25 13:09:38 · 2773 阅读 · 2 评论 -
Nutch中MapReduce的分析
How Map and Reduce operations are actually carried outhttp://wiki.apache.org/nutch/MapReducehttp://wiki.apache.org/hadoop/MapReduce转载地址:http://blog.csdn.net/jiutao_tang/article/details/653转载 2011-11-14 16:38:49 · 1577 阅读 · 0 评论 -
WinXP+cygwin+eclipse配置nutch-1.2,添加IKAnalyzer中文分词
主要参考博客:配置:1,win7下cygwin + Eclipse + Nutch1.2 + Tomcat6 安装配置2,nutch1.1导入eclipse中运行3,nutch研究—基本使用相关说明添加中文分词包:4,Nutch1.2 添加IKAnalyzer中文分词5,nutch研究—遇到的错误和解决办法6,Nutch1.2二次开发详细攻略(四)【图文】---原创 2011-11-07 17:01:01 · 4772 阅读 · 2 评论