互联网Java工程师面试题·Elasticsearch 篇·第二弹

最新推荐文章于 2024-10-01 18:51:18 发布

时光の尘

最新推荐文章于 2024-10-01 18:51:18 发布

阅读量186

点赞数

分类专栏：千题千解·Java面试宝典文章标签： java 开发语言大数据

本文链接：https://blog.csdn.net/MANONGDKY/article/details/133559251

版权

本文涵盖了Elasticsearch的索引文档、更新与删除过程、搜索机制、倒排索引原理、Linux部署优化、GC注意事项、大数据量聚合策略、并发读写一致性、集群监控、电商搜索架构及个性化搜索方案等核心知识点，是Java工程师面试必备的Elasticsearch深度解析。

摘要由CSDN通过智能技术生成

12、详细描述一下 Elasticsearch 索引文档的过程。

协调节点默认使用文档 ID 参与计算（也支持通过 routing ），以便为路由提供合适的分片。

shard = hash(document_id) % (num_of_primary_shards)

1 、当分片所在的节点接收到来自协调节点的请求后，会将请求写入到 Memory Buffer，然后定时（默认是每隔 1 秒）写入到 Filesystem Cache ，这个从 Momery Buffer 到 Filesystem Cache 的过程就叫做 refresh ；

2 、当然在某些情况下，存在 Momery Buffer 和 Filesystem Cache 的数据可能会丢失，ES 是通过 translog 的机制来保证数据的可靠性的。其实现机制是接收到请求后，同时也会写入到 translog 中，当 Filesystem cache 中的数据写入到磁盘中时，才会清除掉，这个过程叫做 flush ；

3 、在 flush 过程中，内存中的缓冲将被清除，内容被写入一个新段，段的 fsync将创建一个新的提交点，并将内容刷新到磁盘，旧的 translog 将被删除并开始一个新的 translog 。

4 、 flush 触发的时机是定时触发（默认 30 分钟）或者 translog 变得太大（默认为 512M ）时；