ES分词学习

在Elasticsearch中,文档指的是索引内的单个记录。当你在一个索引中写入两条不同的文档,如“我在北京天按门”和“我在北京天安门”,每条文档会被独立分析和建立索引,它们之间的内容不会相互影响或覆盖。这里的关键在于,每条文档都是独立的实体。

当你索引多条文档时,Elasticsearch会为每条文档创建一个倒排索引。倒排索引记录的是哪些文档包含了特定的词语。所以,如果两条文档分别包含“天按门”和“天安门”,则倒排索引中会同时存在这两个词的条目,分别指向包含它们的文档。

例如:

  • 倒排索引中的“天按门”条目会指向包含“天按门”的那条文档。
  • 倒排索引中的“天安门”条目会指向包含“天安门”的那条文档。

即使两个词语相似,Elasticsearch也不会自动将它们合并或覆盖。每个词语的出现都会被独立跟踪,除非你在更新某条具体文档时修改了其内容,从而改变了该文档对应的索引条目。

所以,总结来说,如果你在同一个索引中写入了两条不同的文档,每条文档中包含不同的关键词,这些关键词的索引条目不会相互覆盖,而是各自独立存在于倒排索引中。只有当对特定文档进行更新操作时,才会发生索引条目的覆盖或修改。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值