match查询和term查询
match能够实现对查询字符串的模糊匹配,term实现对查询内容的精准匹配,通常可以用来处理数字(numbers)、布尔值(booleans)、日期(dates)以及文本(text)
精准查找价格为20的文档:
{
"from": 0,
"size": 10,
"query": {
"bool": {
"filter": [
{
"term": {
"price": 20
}
}
]
}
}
}
实现子串的查询query_string
为了避免match执行时会将查询字符串进行分词、以及term完全匹配的特点,我们可以使用query_string语法来实现子串的查询,示例代码如下:
{
"from": 0,
"size": 10,
"query": {
"bool": {
"must": [
{
"query_string": {
"default_field": "table_name",
"query": "\"student_info\""
}
}
]
}
}
}
query_string的查询块中指定了两个属性:default_field 指定要查询的字段,query 指定要查询的子串。上述代码的功能就是实现查找table_name字段中包含"student_info"字符串的文档。注意query字段中字符串的表示形式,需要显示的用双引号扩起来,才不会进行分词
想到这里就猜想,在match匹配时,将查询字符串显示的用双引号扩起来是不是也可以避免分词,答案是否定的。示例代码如下:
{
"from": 0,
"size": 10,
"query": {
"bool": {
"must": [
{
"match": {
"table_name": {
"query": "\"student_info\""
}
}
}
]
}
}
}
返回的查询结果显示仍然对query字符串进行了分词匹配,和直接使用不带双引号的查询字符串结果是一样的。
精准搜索字符串怎么破
为什么用term精准搜索字符串会失效,示例代码如下:
{
"from": 0,
"size": 10,
"query": {
"bool": {
"must": [
{
"term": {
"table_name": {
"value": "student_info"
}
}
}
]
}
}
}
我们期望能搜索出table_name为"student_info"的文档,但是却没有返回结果。原因是在建立索引的时候,会对text类型的字段进行分词,然后建立索引,所以table_name字段的倒排索引中是不包含完整的"student_info"这个信息的。
如果要实现对text类型字段的精准匹配,在建立_mapping的时候就要指定:index:not_analyzed。告诉ElasticSearch该字段具有精确值,禁止对该字段的内容进行分词。同样也就失去了模糊匹配的能力