![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
nutch
zhangzhanlei1988
沉稳,致力于计算机编程。
展开
-
hadoop 单机节点安装
Single Node Setup Purpose This document describes how to set up and configure a single-node Hadoop installation so that you can quickly perform simple operations using Hadoop MapReduce and the Ha...原创 2013-11-13 10:28:43 · 32 阅读 · 0 评论 -
nutch 01 认识nutch
1.1 什么是nutch nutch 就一个开源的java 实现的搜索引擎,它提供了我们运行自己的搜索引擎所需的全部工具,包括全文搜索和web爬虫。现在的nutch 的发展趋势是网络爬虫,全文搜索是用lucene的内核,nutch 是lucene的一个子项目,apache 又从nutch项目里面产生了hadoop,tika,gora等其他子项目,其实就是对一些公共模块的封装,重用,然后起个名字,...2013-10-27 18:46:39 · 46 阅读 · 0 评论 -
nutch 02 其它与nutch有关的工具说明
这些框架主要有Lucene、Hadoop、Solr、Tika、Gora、HBase等,其中Nutch是网络爬虫Lucene是全文检索工具包Hadoop是分布式存储与计算Gora是ORM的大数据版Tika是内容分析工具包 上面那几个在以前都说过。Solr是搜索服务器:是一个独立的企业级应用服务器,它对外提供类似于webservice的api 接口。用户可以通过http 请求,搜索服务器提交一定格...2013-10-27 18:49:03 · 38 阅读 · 0 评论 -
nutch 03 nutch 的安装
1.操作系统是ubuntu .在终端用svn工具安装,如果没有svn工具,使用命令安装svn工具。 2.nutch 是使用svn进行源代码管理的,nutch svn 的地址是:http://svn.apache.org/repos/asf/nutch/tags/release-1.7/ release-1.xx 可能有所不同。使用它的源代码,而不是它发布的二进制版本,可...原创 2013-10-28 08:17:59 · 32 阅读 · 0 评论