索引及搜索技术
yy8354
这个作者很懒,什么都没留下…
展开
-
在DotLucene/Lucene.net中, 增加自己的中文分词Analyzer
一种非常简单,但是不是很优化的方法,继承Lucene.Net.Analysis.Analyzer,实现了Lucene.Net.Analysis.Analyzer,Lucene.Net.Analysis.Tokenizer,Lucene.Net.Analysis.TokenFilter的子类.参考了Lucene.Net.Analysis.Cn的实现,该项目采用对汉语进行一元分词.ChineseAna...2009-04-09 09:07:54 · 119 阅读 · 0 评论 -
目前主要的开源索引库列表
Egothorjava信息检索库,捷克人Leo Galambos为开发主理,应用在Capek主页: http://www.egothor.org/XapianC++开发的概率信息检索库,强大的功能,实现范例为 Omega现支持:Perl, Python, PHP, Java, TCL语言主页: http://www.xapian.org/MG-1.2.1Ref: Managing Gigabyte...2009-04-09 09:19:15 · 450 阅读 · 0 评论 -
LUCENE Field字段类型的意义
很多看LUCENE IN ACTION的人,开始写代码最容易遇到的问题就是Field.Keyword Field.UnIndexed Field.UnStored Field.Text……都没了 因为那LUCENE高版本提供的已经有很大区别Field类已经没那些玩意,最近问的人多了,我就把我常用的个简单的转译函数贴这给大家参考 FieldType是个自定义的emnu类型 替代原有的Field.Ke...2009-04-15 12:08:32 · 203 阅读 · 0 评论 -
SuffixTree 后缀树 c#实现
后缀树算是应用比较广泛的字符串处理算法了,压缩方面应用不少。这是我根据JAVA版本改写的版本。2009-04-15 12:13:35 · 152 阅读 · 0 评论