1. Term
Term是表达语意的最小单位。搜索和利用统计语言模型进行自然语言处理都需要term;
特点:
- Term Level Query: Term Query / Range Query / Exsis Query / Wildcard Query
- 在ES中,Term 查询,对输入不做分词。会将输入作为一个整体,在倒排索引中查找准确的语项。
- 可以通过Constant Score 将查询转换成一个FilterIng,避免算分,并利用缓存,提高性能。
POST _bulk
{"index":{"_index":"products","_id":1}}
{"comment":"comment abc","commpany":"commpany def"}
{"index":{"_index":"products","_id":2}}
{"comment":"comment ghi","commpany":"commpany klm"}
{"create":{"_index":"products","_id":3}}
{"comment":"comment 123","commpany":"commpany 456"}
POST /products/_search
{
"explain": true,
"query": {
"constant_score": {
"filter": {
"term": {
"comment": "comment"
}
}
}
}
}
2. 全文查询
Match Query / Match Phrase Query / Query String Query
特点:
- 索引和搜索时都会进行分词,查询字符串先传递到一个合适的分词器,然后生成一个供查询的词项列表。
- 查询会对每个词项逐个进行底层的查询,再将结果进行合并。