lucene-2.4整合"庖丁解牛"
测试用的Lucene版本是lucene-2.4.0,它已经能够支持中文分词,但它是采用一元分词(逐字拆分)的方法,即把每一个汉字当作是一个词,这样会使建立的索引非常庞大,会影响查询效率.所以大多运用lucene的朋友,都会考虑使用其它的中文分词包,这里我就介绍最为常用的"庖丁解牛"分词包,当然它也是一个值得推荐的中文分词包. 本文主要讲解Lucene如何整合"庖丁解牛"分词包,在整...
原创
2010-01-30 22:06:34 ·
115 阅读 ·
0 评论