以前讨论过term query,是要完全匹配查询信息,如果要进行full text全文检索,则需要使用match query
注意:如果要检索的field,是not_analyzed类型的,那么match query也相当于term query。
一、全文检索的主要方式有两种
1、match query
2、should
二、控制搜索结果精准度
1、and operator
2、minimum_should_match
三、举例说明
1、使用and关键字
GET /forum/article/_search
{
"query": {
"match": {
"title": {
"query": "java elasticsearch",
"operator": "and"
}
}
}
}
检索的文档中要包含java和elasticsearch
2、必须至少匹配其中的多少个关键字,才能作为结果返回
GET /forum/article/_search
{
"query": {
"match": {
"title": {
"query": "java elasticsearch spark hadoop",
"minimum_should_match": "75%"
}
}
}
}
3、用bool组合多个搜索条件,来搜索title
GET /forum/article/_search
{
"query": {
"bool": {
"must": { "match": { "title": "java" }},
"must_not": { "match": { "title": "spark" }},
"should": [
{ "match": { "title": "hadoop" }},
{ "match": { "title": "elasticsearch" }}
]
}
}
}
4、bool组合多个搜索条件,如何计算相关度分数(relevance score)
must和should搜索对应的分数,加起来,除以must和should的总数
注意:
(1)should是可以影响相关度分数的
must是确保说,谁必须有这个关键字,同时会根据这个must的条件去计算出document对这个搜索条件的relevance score,在满足must的基础之上,should中的条件,不匹配也可以,但是如果匹配的更多,那么document的relevance score就会更高
(2)在使用must时,should是可以不匹配任何一个的,但是当没有使用must时,那么should中必须至少匹配一个才可以
默认情况下,should是可以不匹配任何一个的,比如上面的搜索中,this is java blog,就不匹配任何一个should条件,只要满足其中一个条件,就可以匹配作为结果返回。当然也可以精准控制,should的4个条件中,至少匹配几个才能作为结果返回
GET /forum/article/_search
{
"query": {
"bool": {
"should": [
{ "match": { "title": "java" }},
{ "match": { "title": "elasticsearch" }},
{ "match": { "title": "hadoop" }},
{ "match": { "title": "spark" }}
],
"minimum_should_match": 3
}
}
}
5、match检索底层实现查询
match query进行多值搜索的时候,es会在底层自动将这个match query转换为bool的语法bool should,指定多个搜索词,同时使用term query。
(1)match转换为term+should
{
"match": { "title": "java elasticsearch"}
}
底层转换为
{
"bool": {
"should": [
{ "term": { "title": "java" }},
{ "term": { "title": "elasticsearch" }}
]
}
}
(2)and match转换为term+must
{
"match": {
"title": {
"query": "java elasticsearch",
"operator": "and"
}
}
}
底层转换为
{
"bool": {
"must": [
{ "term": { "title": "java" }},
{ "term": { "title": "elasticsearch" }}
]
}
}
(3)minimum_should_match 转换成should+term
{
"match": {
"title": {
"query": "java elasticsearch hadoop spark",
"minimum_should_match": "75%"
}
}
}
底层转换为
{
"bool": {
"should": [
{ "term": { "title": "java" }},
{ "term": { "title": "elasticsearch" }},
{ "term": { "title": "hadoop" }},
{ "term": { "title": "spark" }}
],
"minimum_should_match": 3
}
}