lucene
yiluoAK_47
这个作者很懒,什么都没留下…
展开
-
Lucence全文搜索框架
Lucence全文搜索框架 目录(?)[+] 1 lucene简介 1.1 什么是lucene Lucene是一个全文搜索框架,而不是应用产品。因此它并不像www.baidu.com或者google Desktop那么拿来就能用,它只是提供了一种工具让你能实现这些产品。 1.2 lucene能做什么 要回答这个问题,先要了解luc转载 2014-02-07 15:45:16 · 3912 阅读 · 1 评论 -
lucene4.0与IKAnalyzer的冲突
在网上下载了lucene当前最新版本4.0,以及IKAnalyzer中文分词器的完整发布包。 运行之后发现异常:Exception in thread "main" java.lang.VerifyError: class org.wltea.analyzer.lucene.IKAnalyzer overrides final method tokenStream.(Ljava/lang/S转载 2014-02-13 10:01:14 · 7593 阅读 · 0 评论 -
为全文检索方案更新词库
在全文检索应用中,为了提高检索的准确性,我们时常需要定期去更新分词库,以 保证各种网络用语、火文(如“屌丝”、“高帅富”,“美富白”),能正确的被识别。 目前对中文分词比较好的插件主要有ik-analyzer、mmseg、庖丁等。ik是目前使用比较广泛,而且作者刚对其进行了更新,目前已经能支持简单的分词歧义排除算法,详细情况请参见ik的开发网站。本文将以ik来测试新添加的分词。转载 2014-11-04 18:42:07 · 1962 阅读 · 0 评论 -
IKAnalyzer 独立使用 配置扩展词库
网上已有不少教程了。 http://www.cnblogs.com/dennisit/archive/2013/04/07/3005847.html http://blog.sina.com.cn/s/blog_4c9d7da201013wv2.html 这里只说两点: dic文件要用 “无dom的UTF-8”格式编码dic文件最好是放在项目的s转载 2014-11-04 17:04:20 · 1970 阅读 · 1 评论