Query&Filtering与多字符串多字段查询
Query Context & Filter Contxt
- 高级搜索功能 : 支持多项文本输入,针对多个字段进行搜索
- 搜索引擎一般也提供基于时间,价格等条件的过滤
- 在Elasticsearch 中,有Query 和 Filter两种不同的Contxt
- Query Contxt:相关性算分
- Filter Contxt:不需要算分(Yes or No),可以利用Cache,获得更好的性能
bool查询
- 一个bool查询,是一个或者多个查询子句的组合
- 总共包括4种子句。其中2种会影响算分,2种不影响算分
- 相关性并不只是全文本搜索的专利。也适合于 yes | no 的子句,匹配的子句越多,相关性评分越高。如果多条查询子句被合并为一条复合查询语句,比如bool查询,则每个查询子句计算得分的评分会被合并到总的相关性评分中
bool查询语法
- 子查询可以任意顺序出现
- 可以嵌套多个查询
- 如果你的bool查询中,没有must条件,should中 必须至少满足一条查询
如何解决结构化查询 - "包含而不是相等"的问题
- 解决方案:增加一个 genre count字段进行计数
增加count字段,是用bool查询解决
Filter Context - 不影响算分
Query Context - 影响算分
bool嵌套
查询语句的结构,会对相关度算分产生影响
- 同一层级下的竞争字段,具有有相同的权重
- 通过嵌套bool查询,可以改变对算分的影响
控制字段的boosting
-
Boosting是控制相关度的一种手段
- 索引,字段,或者查询子条件
-
参数boost的含义
- 当 boost > 1 时,打分的相关度相对行提升
- 当 0 < boost < 1 时,打分的权重相对性降低
- 当 boost < 0 时,贡献负分
-
Not Quite not (positive、nefative、negative_boost)