网上有好多的Nutch使用的文章,但其实只是几篇文章翻来覆去的拷贝而已!
1.Nutch 初体验
很经典,讲了nutch与lucene 以及其他一些爬虫的比较。和建立一个抓取企业内部网(Intranet crawling)实例。但是可能是版本的问题。其中少了关键的一步。
nutch是一个完整的搜索引擎,但是它只是一个搜索引擎他可以订制的东西太少!例如加中文分词好像要改动源文件,这样做对以后的升级维护都是麻烦。
阅读全文>
发表于 @ 2007年10月21日 09:51:00|评论(loading...)|编辑
平时总是在桌面上新建一个.txt文件来及一些琐碎的东西!每次都用Notepad。今天发现了一个有趣的应用。
那就是在文本的第一行写下“.LOG”,Notepad就会把它当作日志文件,每次打开的时候都会新建一行然后插入当前日期。
阅读全文>
发表于 @ 2007年10月14日 00:19:00|评论(loading...)|编辑