ES在高并发下如何保证读写一致性

知知之之

于 2024-09-03 15:28:10 发布

阅读量386

点赞数 11

分类专栏： Elasticsearch 文章标签： elasticsearch 大数据搜索引擎

本文链接：https://blog.csdn.net/weixin_35973945/article/details/141862712

版权

8 篇文章 0 订阅

订阅专栏

当多个客户端几乎同时对同一个索引进行读和写操作时，Elasticsearch 通过多个机制来管理这种一致性，以下是一些关键点和策略，以确保在高并发环境下的读写一致性：

当进行并发写入时，Elasticsearch 使用版本控制/冲突检测机制来确保一致性：

乐观并发控制：Elasticsearch 在每个文档上维护版本号。每当文档被更新时，该版本号就会增加。当写入操作请求使用一个特定版本时，Elasticsearch 会检查当前存储的版本与请求的版本是否匹配。
冲突处理：如果两个并发请求试图更新同一个文档，只有第一个请求会成功，第二个请求会收到一个版本冲突错误。应用程序可以根据业务逻辑对这些冲突进行处理，比如重试或者合并数据。

Elasticsearch 的默认一致性模型为最终一致性，而不是强一致性。决定使用 GRADUAL 更新模型时需要注意如下：

搜索一致性：Elasticsearch 提供了一个选项，允许搜索请求在读取时返回最新的可用数据。通过使用 refresh 参数，您可以选择读取最新的数据。
写入一致性：在进行写入操作时，Elasticsearch 提供了 wait_for_active_shards 选项，这样可以确保一个写入请求在确认写入到有效的分片副本之后再返回成功。

Elasticsearch 的每个索引都有一个“刷新”操作，这个操作会将内存中的操作记录（如新增、更新、删除）刷新到磁盘，使得这些操作可被搜索到。

默认刷新间隔：默认情况下，Elasticsearch 每 1 秒执行一次刷新操作。您可以根据需求通过调整 refresh_interval 参数来减少刷新频率，从而在高并发写入时提升性能。
手动刷新：在一些情况下，您可能希望等待操作完成（特别是在批量写入后），然后显式调用 _refresh API，以确保后续的搜索请求能够看到新的数据。

Elasticsearch 使用分段（segment）来存储数据。随着写入操作的增多，分段可能会产生许多小的段。

高并发意味着大量的读写请求，以及可能的资源竞争。您可以通过以下方式优化性能：

如果使用 Elasticsearch 作为实时日志存储，建议：

关注

专栏目录