Elasticsearch——倒排索引与分词

正排索引和倒排索引

正排索引:
文档ID到文档内容、单词的关联关系
在这里插入图片描述
根据文档id获取文档内容

倒排索引:
单词到文档ID的关联关系:
在这里插入图片描述
根据单词可以获取到它属于哪个文档

两者关系:
在这里插入图片描述
将文档内容分词即可得到倒排索引。

因此我们可以将两者结合实现一个搜索流程:
在这里插入图片描述

倒排索引的构成

单词词典

在这里插入图片描述
在这里插入图片描述

倒排列表

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

分词

分词是将文本转换成一系列单词的过程,也可以叫做文本分析,在es里面称为Analysis
在这里插入图片描述
在这里插入图片描述

Analyze API

在这里插入图片描述
当查询结果与预期不匹配的时候,可以用这些分词器接口进行测试:

standard是es的默认分词器
在这里插入图片描述
在这里插入图片描述在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

es自带分词器

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
在这里插入图片描述在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

自定义分词

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

官方文档:
链接: https://www.elastic.co/guide/en/elasticsearch/reference/current/index.html
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

GuochaoHN

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值