ElasticSeach基本查询

最新推荐文章于 2023-04-16 18:49:20 发布

章鱼kn

最新推荐文章于 2023-04-16 18:49:20 发布

阅读量230

点赞数

分类专栏：数据库中间件文章标签： elasticsearch 数据库

本文链接：https://blog.csdn.net/ivanIJ/article/details/105687749

版权

数据库同时被 2 个专栏收录

3 篇文章 0 订阅

订阅专栏

中间件

1 篇文章 0 订阅

订阅专栏

结构化查询（DSL）

match（分词匹配）

查询和"我的宝马多少马力"这个查询语句匹配的文档

{ "query": { "match": { "content" : { "query" : "我的宝马多少马力" } } } }

语句"我的宝马多少马力"进行分词后搜索，并且根据lucene的评分机制(TF/IDF)来进行评分。

match_phrase（都包含）

比如上面一个例子，一个文档"我的保时捷马力不错"也会被搜索出来，那么想要精确匹配所有同时包含"宝马多少马力"的文档怎么做？就要使用 match_phrase 了

{ "query": { "match_phrase": { "content" : { "query" : "我的宝马多少马力", "slop" : 1 //可调节因子，少匹配一个也满足 } } } }

multi_match

如果我们希望两个字段进行匹配，其中一个字段有这个文档就满足的话，使用multi_match

{ "query": { "multi_match": { "query" : "我的宝马多少马力", "fields" : ["title", "content"] //两个字段进行匹配，其中一个字段有这个文档就满足 } } }

但是multi_match就涉及到匹配评分的问题了。

我们希望完全匹配的文档占的评分比较高，则需要使用best_fields

{ "query": { "multi_match": { "query": "我的宝马发动机多少", "type": "best_fields", //完全匹配的文档占的评分比较高 "fields": [ "tag", "content" ], "tie_breaker": 0.3 //取0时即为仅使用最佳匹配子句,取1则会将所有匹配的子句一视同仁 } } }

意思就是完全匹配"宝马发动机"的文档评分会比较靠前，如果只匹配宝马的文档评分乘以0.3的系数

tie_breaker参数改变分值计算过程：

取得最佳匹配查询子句的_score。
将其它每个匹配的子句的分值乘以tie_breaker。
将以上得到的分值进行累加并规范化。

取0时即为仅使用最佳匹配子句,取1则会将所有匹配的子句一视同仁

我们希望越多字段匹配的文档评分越高，就要使用most_fields

{ "query": { "multi_match": { "query": "我的宝马发动机多少", "type": "most_fields", "fields": [ "tag", "content" ] } } }

这个词条的分词词汇是分配到不同字段中，那么就用cross_fields

{ "query": { "multi_match": { "query": "我的宝马发动机多少", "type": "cross_fields", "fields": [ "tag", "content" ] } } }

【term】

term是代表完全匹配，即不进行分词器分析，文档中必须包含整个搜索的词汇

{ "query": { "term": { "content": "汽车保养" } } }

查出的所有文档都包含"汽车保养"这个词组的词汇。

章鱼kn

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
ElasticSeach基本查询

结构化查询（DSL）match（分词匹配）查询和"我的宝马多少马力"这个查询语句匹配的文档{ "query": { "match": { "content" : { "query" : "我的宝马多少马力" } } } }语句"我的宝马多少马力"进行分词后搜索，并且根据lucene的评分机制(TF/IDF)来进行评分。match_phrase（都包含）比如上面一个例子，一个...
复制链接

扫一扫

专栏目录