ElasticSearch 面试 4 连问_4elasticsearch 面试-CSDN博客

本文链接：https://blog.csdn.net/qq_36721495/article/details/124598617

本文详细介绍了Elasticsearch的数据写入过程，包括客户端如何选择节点，协调节点如何路由，主分片和复制节点的角色。同时，阐述了查询机制，通过docid进行路由和负载均衡的读取方式。还提及了Lucene作为Elasticsearch的底层索引库，用于创建倒排索引，加速数据检索。

摘要由CSDN通过智能技术生成

ES 写入数据的工作原理是什么？
1）客户端选择一个node（协调节点）发送请求过去。
2）coordinating node（协调节点），对document（row行）进行路由，将请求转发给对应的node（主分片）
3）实际的node上的primary shard（主分片）处理请求，然后将数据同步到replica node（复制节点）
4）coordinating node，如果发现primary node（主分片）和所有replica node（复制节点）都搞定之后，就返回响应结果给客户端

ES 查询数据的工作原理是什么？
查询，GET某一条数据，写入了某个document（row行），这个document会自动给你分配一个全局唯一的id，doc id，同时也是根据doc id进行hash路由到对应的primary shard（主分片）上面去。也可以手动指定doc id，比如用订单id，用户id。
你可以通过doc id来查询，会根据doc id进行hash，判断出来当时把doc id分配到了哪个shard上面去，从那个shard去查询
1）客户端发送请求到任意一个node，成为coordinate node（协调节点）
2）coordinate node对document进行路由，将请求转发到对应的node，此时会使用round-robin随机轮询算法，在primary shard以及其所有replica中随机选择一个，让读请求负载均衡
3）接收请求的node返回document给coordinate node（协调节点）
4）coordinate node返回document给客户端

底层的 Lucene 介绍一下？
简单来说，lucene 就是一个 jar 包，里面包含了封装好的各种建立倒排索引的算法代码。我们用 Java 开发的时候，引入 lucene jar，然后基于 lucene 的 api 去开发就可以了。
通过 lucene，我们可以将已有的数据建立索引，lucene 会在本地磁盘上面，给我们组织索引的数据结构。

倒排索引了解吗？
在搜索引擎中，每个文档都有一个对应的文档 ID，文档内容被表示为一系列关键词的集合。例如，文档 1 经过分词，提取了 20 个关键词，每个关键词都会记录它在文档中出现的次数和出现位置。
那么，倒排索引就是关键词到文档 ID 的映射，每个关键词都对应着一系列的文件，这些文件中都出现了关键词。