Nutch的安装

tomcat

NUTCH安装
http://blog.csdn.net/zjzcl/archive/2006/02/01/590537.aspx
http://blog.csdn.net/zjzcl/archive/2006/02/06/593138.aspx

Nutch搜索技术相关的资料.oO

┌─────────────────────────
│Nutch相关的资料 - 中文处理 (05年06月17日开始收集)    
└─────────────────────────

http://issues.apache.org/jira/browse/NUTCH-36
http://www.mail-archive.com/nutch-developers@lists.sourceforge.net/msg03907.html

以上两个链接的内容出处相同,都是Apache Nutch dev mail archive。
由Jack Tang于04-Apr-2005提出,是描述在Nutch搜索中加入中文支持的技术。
因为刚刚提出,没有成熟,需要探索才能使用,有点挑战!希望早日搞定!

┌─────────────────────────
│Nutch相关的资料 - Apache (05年06月14日开始收集)    
└─────────────────────────

Nutch JavaDoc Overview (Nutch 0.6 API)
Nutch的Java代码文档。

Nutch Mailing Lists
Nutch的邮件列表。

Nutch - Tutorial
Nutch的教程。(入门必读!)

Nutch Wiki - Dissecting The Nutch Crawler
Nutch维基:分解Nutch爬虫。(有相当详尽的资料,值得研读!)

Nutch Wiki - Distributed Web DB
Nutch维基:分布式网页数据库。

Nutch Wiki - Front Page
Nutch维基:入口。

Nutch Wiki - Nutch Distributed File System
Nutch维基:Nutch分布式文件系统。

Nutch Wiki - Nutch File Formats
Nutch维基:Nutch文件格式。

Nutch Wiki - Web DB
Nutch维基:Nutch文件系统。(旧的版本!)

Nutch Wiki - Why Nutch Has A Plugin System
Nutch维基:讲述Nutch的插件系统,可惜不全。

┌─────────────────────────
│Nutch相关的资料 - Online (05年06月08日开始收集)    
└─────────────────────────

Nutch Documentation
This is not the offical nutch wiki, but some private collected documentation!!!
By Stefan Groschupf.

未知都是已知的 - Fenng's BLOG Nutch 初体验之一
什么是 Nutch ? Nutch 和 Larbin / Lucene 相比较有什么不同? 测试笔记。

未知都是已知的 - Fenng's BLOG Nutch 初体验之二
介绍一下 Nutch 进行全网的爬行(Whole-web Crawling) 的操作测试过程以及注意事项。

竹笋炒肉 - 试用Nutch
是作者对nutch的一些试用记录。作者认为,搭建网站时实现本站检索的最好的方案,是采用车东基于lucene的开源项目web lucene的软件包。而nutch似乎比较适合于建立垂直搜索引擎网站。

Nutch - A Flexible and Scalable Open-Source Web Search Engine 
(PDF File,是一篇Doug Cutting参与的描述Nutch的论文。)

Nutch - Open Source Web Search Software
(PDF File,是一篇Doug Cutting的introduce Nutch的power point file。)

http://www.mail-archive.com/nutch-developers@lists.sourceforge.net/msg03641.html
关于“International Parser”,Doug Cutting replied to this thread.

http://www.opensubscriber.com/message/nutch-developers@lists.sourceforge.net/1436319.html
关于Myanmar language analyzer。

SatireWire  Vearch - Vertical Search Engines
Known as "vearch" engines, these new players provide unprecedented speed and relevancy by cataloging a narrow selection of sites...


天地任我行。。。


Trackback: http://tb.donews.net/TrackBack.aspx?PostId=694497

转载于:https://www.cnblogs.com/abob/archive/2006/08/20/481606.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值