为全文检索方案更新词库

在全文检索应用中,为了提高检索的准确性,我们时常需要定期去更新分词库,以 保证各种网络用语、火文(如“屌丝”、“高帅富”,“美富白”),能正确的被识别。  目前对中文分词比较好的插件主要有ik-analyzer、mmseg、庖丁等。ik是目前使用比较广泛,而且作者刚对其进行了更新,目前...

2014-11-04 18:42:07

阅读数:1647

评论数:0

IKAnalyzer 独立使用 配置扩展词库

网上已有不少教程了。 http://www.cnblogs.com/dennisit/archive/2013/04/07/3005847.html http://blog.sina.com.cn/s/blog_4c9d7da201013wv2.html 这里...

2014-11-04 17:04:20

阅读数:1642

评论数:1

lucene4.0与IKAnalyzer的冲突

在网上下载了lucene当前最新版本4.0,以及IKAnalyzer中文分词器的完整发布包。 运行之后发现异常:Exception in thread "main" java.lang.VerifyError: class org.wltea.analyzer.lucen...

2014-02-13 10:01:14

阅读数:6352

评论数:0

Lucence全文搜索框架

Lucence全文搜索框架 目录(?)[+] 1 lucene简介 1.1 什么是lucene Lucene是一个全文搜索框架,而不是应用产品。因此它并不像www.baidu.com或者google Desktop那么拿来就能用,它只是提供了一种工具让你能实现这些产品。 ...

2014-02-07 15:45:16

阅读数:3202

评论数:1

提示
确定要删除当前文章?
取消 删除
关闭
关闭