Lucene+paoding 使用"庖丁解牛" 构建Analyzer paoding
转自:http://2024486.blog.51cto.com/339445/155642
注意:这里配置环境变量要重新启动系统后生效
我现在测试用的Lucene版本是lucene-2.4.0,它已经能够支持中文分词,但它是采用一元分词(逐字拆分)的方法,即把每一个汉字当作是一个词,这样会使建立的索引非常庞大,会影响查询效率.所以大多运用lucene的朋友,都会考虑使用其它的
转载
2015-05-25 15:07:47 ·
405 阅读 ·
0 评论