ElasticSearch 面试 4 连问

本文详细介绍了Elasticsearch的数据写入过程,包括客户端如何选择节点,协调节点如何路由,主分片和复制节点的角色。同时,阐述了查询机制,通过docid进行路由和负载均衡的读取方式。还提及了Lucene作为Elasticsearch的底层索引库,用于创建倒排索引,加速数据检索。
摘要由CSDN通过智能技术生成

ES 写入数据的工作原理是什么?
1)客户端选择一个node(协调节点)发送请求过去。
2)coordinating node(协调节点),对document(row行)进行路由,将请求转发给对应的node(主分片)
3)实际的node上的primary shard(主分片)处理请求,然后将数据同步到replica node(复制节点)
4)coordinating node,如果发现primary node(主分片)和所有replica node(复制节点)都搞定之后,就返回响应结果给客户端

ES 查询数据的工作原理是什么?
查询,GET某一条数据,写入了某个document(row行),这个document会自动给你分配一个全局唯一的id,doc id,同时也是根据doc id进行hash路由到对应的primary shard(主分片)上面去。也可以手动指定doc id,比如用订单id,用户id。
你可以通过doc id来查询,会根据doc id进行hash,判断出来当时把doc id分配到了哪个shard上面去,从那个shard去查询
1)客户端发送请求到任意一个node,成为coordinate node(协调节点)
2)coordinate node对document进行路由,将请求转发到对应的node,此时会使用round-robin随机轮询算法,在primary shard以及其所有replica中随机选择一个,让读请求负载均衡
3)接收请求的node返回document给coordinate node(协调节点)
4)coordinate node返回document给客户端

底层的 Lucene 介绍一下?
简单来说,lucene 就是一个 jar 包,里面包含了封装好的各种建立倒排索引的算法代码。我们用 Java 开发的时候,引入 lucene jar,然后基于 lucene 的 api 去开发就可以了。
通过 lucene,我们可以将已有的数据建立索引,lucene 会在本地磁盘上面,给我们组织索引的数据结构。

倒排索引了解吗?
在搜索引擎中,每个文档都有一个对应的文档 ID,文档内容被表示为一系列关键词的集合。例如,文档 1 经过分词,提取了 20 个关键词,每个关键词都会记录它在文档中出现的次数和出现位置。
那么,倒排索引就是关键词到文档 ID 的映射,每个关键词都对应着一系列的文件,这些文件中都出现了关键词。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

星空 | 永恒

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值