〇,概述与索引

本文为solomon@javaeye原创,如有转载,注明出处(作者solomon与链接[url]http://zolomon.iteye.com[/url]).
本专题使用中文分词为ikanalyzer,感谢其作者为java中文事业做出的巨大贡献.
我的个人资料[url]http://www.google.com/profiles/solomon.royarr[/url]

本专题包括9个部分.
前3个部分在实施人员的使用层面,
第4部分提供更详细的nutch配置属性的讲解,
第5部分在开发人员的使用层面,
6到8部分在源码研究层面,
第9部分是在二次开发(zh本地化)之后linux实施与管理员如何使用nutch提供的命令与工具进行大型搜索引擎的部署.
由于笔者比较懒,又要上班,所以文章更新进度不会很快,
预计1~8部分在两个月内完成.
第9部分笔者也没接触过,没有预计时间,也可能会搁浅.

废话说了不少,下面进入正题:
首先介绍一些资源一些资源:
nutch 主页: [url]http://lucene.apache.org/nutch/[/url]
nutch wiki: [url]http://wiki.apache.org/nutch/[/url]
nutch入门教程: [url]http://lucene.apache.org/nutch/tutorial.html[/url]
ikanalyzer的友人: [url]http://linliangyi2007.iteye.com/[/url]
ikanalyzer: [url]http://linliangyi2007.iteye.com/blog/41014[/url]
截止到笔者书写这篇的时候,nutch官方入门教程还没有更新仍然是0.7的内容.

下面各链接为9部分内容.
初稿只写了1~3部分,
阅读者可以根据这1~3步初步运行起nutch的搜索网站与爬虫.
这3部分仍未写全,所以这3步与后面6步都会不断增加,更新与补全.

1)准备工作,nutch 1.0 的下载与抽取[url]http://zolomon.iteye.com/blog/373079[/url]
2)nutch 1.0 web应用部署[url]http://zolomon.iteye.com/blog/373080[/url]
3)nutch 1.0 爬虫配置与运行[url]http://zolomon.iteye.com/blog/373084[/url]
4)nutch 1.0 网站与爬虫的属性配置文件研究[url]http://zolomon.iteye.com/blog/378871[/url]
5)使用nutch 1.0 api 进行定制开发
6)构建eclipse nutch 1.0 工程
7)nutch 1.0 源码研究
8)对nutch 1.0 进行二次开发,nutch 1.0 插件的编写
9)nutch 1.0 高级使用

抱歉读者最近没有及时更新.
前一段时间工作上比较忙,
最近由于个人原因于2009年8月无限期暂时停止更新.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值