![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
搜索
lin23871
这个作者很懒,什么都没留下…
展开
-
Lucene为数据库建索引
如果要构建一个全文检索系统,并且文章全部保存在数据库中,那下面的例子会有很大的帮助.package gzu.lyq.db; import java.sql.*; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.documen...原创 2009-03-11 10:04:30 · 86 阅读 · 0 评论 -
Lucene整合"庖丁解牛"中文分词包
我现在测试用的Lucene版本是lucene-2.4.0,它已经能够支持中文分词,但它是采用一元分词(逐字拆分)的方法,即把每一个汉字当作是一个词,这样会使建立的索引非常庞大,会影响查询效率.所以大多运用lucene的朋友,都会考虑使用其它的中文分词包,这里我就介绍最为常用的"庖丁解牛"分词包,当然它也是一个值得推荐的中文分词包. 本文主要讲解Lucene如何整合"...原创 2009-03-11 10:05:42 · 103 阅读 · 0 评论 -
Lucene索引原理
Lucene是一个高性能的java全文检索工具包,它使用的是倒排文件索引结构。该结构及相应的生成算法如下: 0)设有两篇文章1和2 文章1的内容为:Tom lives in Guangzhou,I live in Guangzhou too. 文章2的内容为:He once lived in Shanghai. 1)由于lucene是基于关键词索引和查询的,首先我们要取得这两篇文章...原创 2009-03-29 10:21:28 · 55 阅读 · 0 评论