Luence
文章平均质量分 77
SweetRZ
这个作者很懒,什么都没留下…
展开
-
几种开源分词工具的比较
搜集了一些资料,与同学一起进行了简单的测试,总结如下。 分词工 具 特点 支持语言 原理 词典及扩展性 StandardAnalyzer 中文、英文(unicode) 中文:单字符切分 英文:根据空格切分 ChineseAnalyzer 中文,不支持中转载 2014-03-28 09:10:52 · 2031 阅读 · 0 评论 -
Lucene学习总结之一:全文检索的基本原理
根据http://lucene.apache.org/java/docs/index.html定义: Lucene是一个高效的,基于Java的全文检索库。 所以在了解Lucene之前要费一番工夫了解一下全文检索。 那么什么叫做全文检索呢?这要从我们生活中的数据说起。 我们生活中的数据总体分为两种:结构化数据和非结构化数据。 结构化数据:指具有固定格式或有限长度的数据,转载 2014-03-27 20:56:40 · 719 阅读 · 0 评论