1.es的打分机制
确定文档和查询有多么相关的过程被称为打分。我们希望更为相关的文档被优先返回。
TF-IDF(TF:词频,IDF:逆文档频率)
词频:一个词条出现在某个文档中次数越多就越相关。
逆文档频率:该词条在不同文档中出现的次数越多,它就越不相关。
调和因子:考虑搜索过多少文档以及发现了多少词条
2.其他打分方法
BM25:概率相关性算法
3.boosting
boosting:用来修改文档相关性的程序。
3.1索引期间的boosting
3.2查询期间的boosting
4.function_score
使用不同的函数对最后查询的得分进行影响。
1.weight函数
2.合并得分(合并文档得分和函数计算的分数:替换,乘积等)
3.field_value_factor(字段值对最后的得分有影响,如事件评论数)
4.脚本
5.随机
6.衰减函数
5.字段数据
5.1字段数据缓存(按照某个字段排序或者聚集操作使用)
5.2管理字段数据(1.限制缓存大小和时间,2断路器,3.文档值,即和索引一样放入磁盘中)