正排索引和倒排索引
正排索引:
文档ID到文档内容、单词的关联关系
根据文档id获取文档内容
倒排索引:
单词到文档ID的关联关系:
根据单词可以获取到它属于哪个文档
两者关系:
将文档内容分词即可得到倒排索引。
因此我们可以将两者结合实现一个搜索流程:
倒排索引的构成
单词词典
倒排列表
分词
分词是将文本转换成一系列单词的过程,也可以叫做文本分析,在es里面称为Analysis
Analyze API
当查询结果与预期不匹配的时候,可以用这些分词器接口进行测试:
standard是es的默认分词器
es自带分词器
自定义分词
官方文档:
链接: https://www.elastic.co/guide/en/elasticsearch/reference/current/index.html