IKanalyzer
javasss521
这个作者很懒,什么都没留下…
展开
-
Nutch 文件配置
Nutch 的配置文件几乎覆盖了Nutch 所有的功能。以前在网上看到过一个关于Nutch-default.XML 配置项解释,地址我没收藏,和本文配合起来看,会更好一些。这里我也不打算对其配置文件中的每一项做解释,如果在下面的解释里找不到想要的内容,请发表评论,我会回复的。 http.max.delays 20 The number of times a threa...原创 2011-07-19 17:09:05 · 72 阅读 · 0 评论 -
Lucene原理
Luncene是什么 Lucene是一个高性能的全文检索工具包,它使用的是倒排文件索引结构。Lucene可以对任何的数据做索引和搜索. Lucene不管数据源是什么格式,只要它能被转化为文字的形式,就可以被Lucene所分析利用.也就是说不管是MS word, Html ,pdf还是其他什么形式的文件只要你可以从中抽取出文字形式的内容就可以被Lucene所用.你就可以用Lucene对它们进...原创 2011-07-21 09:11:46 · 61 阅读 · 0 评论 -
Luncene 之一 :创建索引(Luncene + paoding)
Luncene是什么就不介绍了。 下载地址:http://code.google.com/p/paoding/downloads/detail?name=paoding-analysis-2.0.4-beta.zip&can=2&q= luncene的API:http://lucene.apache.org/java/2_9_1/api/all/index.html 学习代码: h...原创 2011-07-21 09:34:19 · 276 阅读 · 0 评论