es

最新推荐文章于 2023-11-02 07:00:00 发布

杰KaMi

最新推荐文章于 2023-11-02 07:00:00 发布

阅读量322

点赞数

分类专栏：学习

本文链接：https://blog.csdn.net/TheNew_One/article/details/105707503

版权

25 篇文章 0 订阅

订阅专栏

搜索服务器

分布式架构下，每台机器都会有一个es节点，当es的客户端向es写数据的时候，会选择一个es节点，同时为了防止数据超过某一个节点的存储限制，会将数据拆分成多个分片shard，每个分片都存储一部分数据，分落到每一个节点中。
这个分片负责写数据，同时会备份一个分片，当主分片写完数据时会同步到备份分片中。
备份分片存在别的节点上，这样的话，假设在集群模式下，master节点挂了，es会选举一个节点成为master节点，es就会发现原先的节点里面分片无法进行写操作，就会找到该分片的备份分片，变为主分片来进行写操作。
当客户端向es里面读取数据的时候，主分片（primary shard）和备份分片（replica shard）都会提供读的操作。

数据写到内存buffer中，这个时候数据时搜索不到的。
当buffer中有数据。默认每隔一秒后，会数据刷（refresh）到os cache先缓存下。这个时候数据就可以被搜索到了，buffer清空。
每个五秒将os cache写到日志文件中
当translog的数据达到一定的阈值，就会触发commit操作。
该操作让buffer的数据刷到os cache中，清空buffer，然后写一个 commit point 写到磁盘文件。
最后会把os cache所有数据刷到一个个segment file文件中。清空日志文件。默认三十分钟
当机器宕机，重启后es会自动读取日志文件的数据，恢复到内存buffer。
可能会有五秒的数据丢失问题，可以设置一个参数，使写入数据到buffer同时到日志文件，但是会导致性能将下一个数量级。
删除数据会在一个del文件中标识该数据被删除了，当客户端搜索数据的时候发现数据本标识成删除状态就不会搜索出来。
10.当磁盘文件多到一个程度中会触发merge操作，合并所有 segmentfile 就会物理删除数据。