前言
Match query可以用于对text、number、date、boolean进行内容匹配,并在匹配前会对查找的内容进行分词分析,按照分词进行匹配,ES为Match query提供了很多参数,本文主要来学习一下这些参数的具体作用。
数据准备
建立一个索引,以及定义好mapping
PUT /my-index-01
{
"mappings": {
"properties": {
"name":{
"type": "keyword"
},
"full_name":{
"type": "text"
}
}
}
}
插入5条文档
PUT /my-index-01/_doc/1
{
"name":"zhang",
"full_name":"zhang san"
}
PUT /my-index-01/_doc/2
{
"name":"li",
"full_name":"li si"
}
PUT /my-index-01/_doc/3
{
"name":"wang",
"full_name":"wang wu"
}
PUT /my-index-01/_doc/4
{
"name":"zhang",
"full_name":"zhang wu ji"
}
PUT /my-index-01/_doc/5
{
"name":"zhang",
"full_name":"zhang san san"
}
query
先来看看不带任何参数的query查询
如果查询,命中了3条文档,可以看出,match query是根据分词结果进行模糊查询,只要文档数据中有一个词项命中,就返回结果。
GET /my-index-01/_search
{
"query": {
"match": {
"full_name": {
"query": "zhang"
}
}
}
}
所以即使你用zhang san san进行查询,一样可以查询到3条文档数据。
GET /my-index-01/_search
{
"query": {
"match": {
"full_name": {
"query": "zhang san san"
}
}
}
}
analyzer
es允许你指定分词器进行查询,如果不指定,则使用索引的默认分词器
GET /my-index-01/_search
{
"query": {
"match": {
"full_name": {
"query": "zhang san san",
"analyzer": "standard"
}
}
}
}
operator
可以通过operator对文档中的结果进行boolean逻辑。
比如,设定operator为and,则查询zhang san就只能返回两条文档数据。
GET /my-index-01/_search
{
"query": {
"match": {
"full_name": {
"query": "zhang san",
"operator": "and"
}
}
}
}
当然如果设置成or,则又是3条,默认为or
GET /my-index-01/_search
{
"query": {
"match": {
"full_name": {
"query": "zhang san",
"operator": "or"
}
}
}
}
fuzziness
这个参数允许查询条件中出现一定数量的不匹配。
当fuzziness为0时,查询结果正常
GET /my-index-01/_search
{
"query": {
"match": {
"full_name": {
"query": "zhang",
"fuzziness": "0"
}
}
}
}
此时如果我们把查询条件中的zhang替换成zheng,很明显是查不到数据的
GET /my-index-01/_search
{
"query": {
"match": {
"full_name": {
"query": "zheng",
"fuzziness": "0"
}
}
}
}
但是此时如果把fuzziness设置为1,则又可以查询到了
当然如果条件错误变成2个,那么相应的fuzziness也需要设置为2
可以看到fuzziness就是用来控制查询条件中不匹配的数量的,注意fuzziness的取值范围为0-2