Lucene搜索引擎

版权声明:本文为博主原创文章,转载请附带原文地址。 https://blog.csdn.net/u012869196/article/details/78226801

Lucene入门教程:
http://blog.csdn.net/tianlincao/article/details/6867127/
Lucene教程:
http://www.cnblogs.com/zhuxiaojie/p/5277219.html

步骤:
1、索引创建
2、文本搜索

注意:
1、lucene的索引不能太大,要不然效率会很低。大于1G的时候就必须考虑分布索引的问题
2、不建议用多线程来建索引,产生的互锁问题很麻烦。经常发现索引被lock,无法重新建立的情况
3、中文分词是个大问题,目前免费的分词效果都很差。如果有能力还是自己实现一个分词模块,用最短路径的切分方法,网上有教材和demo源码,可以参考。
4、建增量索引的时候很耗cpu,在访问量大的时候会导致cpu的idle为0
5、默认的评分机制不太合理,需要根据自己的业务定制

没有更多推荐了,返回首页

私密
私密原因:
请选择设置私密原因
  • 广告
  • 抄袭
  • 版权
  • 政治
  • 色情
  • 无意义
  • 其他
其他原因:
120
出错啦
系统繁忙,请稍后再试