ps:临时写的,大体的实现和简单版, 以后会不断完善 博客和 代码
github:https://github.com/Eric-ly/solr_engine
solr是基于lucene的全文检索 搜索引擎,和一般查数据库相比,solr的一个特色就是它的相关度评分。 这里介绍一下它的自定义 相关度评分。
solr的评分是需要考虑很多因素的 有一个公式,比如会考虑 一句话中 关键字出现的频率,一片文章中关键字出现的频率和这篇文章的长度 来综合计算相关度评分。
在实际的业务中,可能不需要这么复杂的相关度,是需要简单粗暴的 按照我指定的规则计算相关度,并按照相关度进行排序。使用默认的话 因为因素过多 (比如分数小数太多) 可能不能让评分按照我自己的方式计算(最后分数)即最后的分数会有差别。
需求问题,比如:
我只想要 滑雪 加10分 然后我根据标题包含滑雪的排序
1.标题 含滑雪 > 标题 不含 滑雪
2.正文含滑雪 >正文不含滑雪
3.文章的质量分 高大于 低
这个时候如果用默认的 我无法 在滑雪中根据正文包含 或者 质量分进行二层,三层排序, 因为 条件1 &#