探讨lucene检索优化

最新推荐文章于 2023-05-29 02:03:01 发布

自行车在路上

最新推荐文章于 2023-05-29 02:03:01 发布

阅读量101

点赞数

分类专栏：工作相关文章标签： java

本文链接：https://blog.csdn.net/qq_42745404/article/details/105019612

版权

工作相关专栏收录该内容

21 篇文章 0 订阅

订阅专栏

探讨lucene检索优化

个人认为：

索引库具有的词语比较全面
用户输入的词增加在数据库中添加相应的次数
搜索的时候根据词语的次数权重排序

针对南京km的问题：

应该从html编辑器拿取的文本去除掉html标签，放进检索库
搜索的词语放进数据库做词语次数的统计
根据统计去索引库拿取词语权重搜索后,再用点击次数排列

应该从html编辑器拿取的文本去除掉html标签，放进检索库

用正则表达式把html标签去除

搜索的词语放进数据库做词语次数的统计(或许有更好的方法)

根据统计去索引库拿取词语权重搜索后,再用点击次数排列

关键词转成词语的数组后，需要去掉语气词，及单个字。

搜索词语权重代码例子：

Term term = new Term(IndexContants.FIELD_TITLE, keyWord);
FuzzyQuery fuzzyQuery = new FuzzyQuery(term);
float weight1 = (float)2000.0;
fuzzyQuery.setBoost(weight1);
query.add(fuzzyQuery, BooleanClause.Occur.SHOULD);

先根据词语权重搜索出来后，然后再点击次数排序,参考例子:

Collections.sort(updateList, new Comparator<FileEntity>() {
    @Override
    public int compare(FileEntity o1, FileEntity o2) {
    	return (int) ( o2.getViews() - o1.getViews());
    }
});

自行车在路上

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
探讨lucene检索优化

探讨lucene检索优化个人认为：索引库具有的词语比较全面用户输入的词增加在数据库中添加相应的次数搜索的时候根据词语的次数权重排序针对南京km的问题：应该从html编辑器拿取的文本去除掉html标签，放进检索库搜索的词语放进数据库做词语次数的统计根据统计去索引库拿取词语权重搜索后,再用点击次数排列应该从html编辑器拿取的文本去除掉html标签，放进检索库用正则表达...
复制链接

扫一扫