Elasticsearch:文档存储

二狗plus

已于 2023-06-11 22:07:42 修改

阅读量1.3k

点赞数 2

分类专栏： Elasticserach 文章标签： elasticsearch

于 2021-06-14 22:48:00 首次发布

本文链接：https://blog.csdn.net/weixin_41860630/article/details/117914076

版权

Elasticserach 专栏收录该内容

19 篇文章 7 订阅

订阅专栏

Q1:当我们创建文档时，ElasticSearch如何知道这个文档应该存储到哪个分片中？

A1：根据下方公式：

   shard = hash(routing) % number_of_primary_shards

   routing : 是一个可变值，默认是文档的_id，也可以设置成自定义的值。

   number_of_primary_shards : 主分片的数量。

   shard : 取值范围在 0 - (number_of_primary_shards - 1) 之间

Q2:为什么在创建索引的时候要确定好主分片的数量，并且不可改变这个数量？

A2：因为在创建文档时，使用了A1展示的公式。如果在创建文档之后改变分片的数量，公式中的值：number_of_primary_shards发生变化，那么之前所有路由的值都会无效，之前创建的文档也找不到了。

Q3：ElasticSearch为什么是近实时搜索而不是实时搜索？

Q4：ElasticSearch分片内部的写入和删除流程？

Q5：ElasticSearch的段合并？

Lucene

Lucene 是 Elasticsearch所基于的 Java 库，它引入了按段搜索的概念。

Segment：也叫段，类似于倒排索引，相当于一个数据集。

Commit point：提交点，记录着所有已知的段。

Lucene index： “a collection of segments plus a commit point”。由一堆 Segment 的集合加上一个提交点组成。

对于一个 Lucene index 的组成，如下图所示:

Elasticsearch

一个 Elasticsearch Index 由一个或者多个 shard （分片）组成。

而 Lucene 中的 Lucene index 相当于 ES 的一个 shard。

写入过程

不断将 Document 写入到 In-memory buffer （内存缓冲区）。
当满足一定条件后内存缓冲区中的 Documents 刷新到高速缓存（cache）。
生成新的 segment ，这个 segment 还在 cache 中。
这时候还没有 commit ，但是已经可以被读取了。

如下图：

数据从buffer到cache的过程是定期每秒刷新一次。所以新写入的document最慢1秒就可以在cache中被搜索到。

而document从buffer到cache的过程叫做refresh，一般是1秒刷新一次，不需要进行额外修改。

Translog 事务日志

此处可以联想 Mysql 的 binlog， ES 中也存在一个 translog 用来失败恢复。

Document 不断写入到 In-memory buffer，此时也会追加 translog。
当 buffer 中的数据每秒 refresh 到 cache 中时，translog 并没有进入到刷新到磁盘，是持续追加的。
translog 每隔 5s 会 fsync 到磁盘。
translog 会继续累加变得越来越大，当 translog 大到一定程度或者每隔一段时间，会执行 flush。

flush 操作会分为以下几步执行：

buffer 被清空。
记录 commit point。
cache 内的 segment 被 fsync 刷新到磁盘。
translog 被删除。

值得注意的是：

translog 每 5s 刷新一次磁盘，所以故障重启，可能会丢失 5s 的数据。
translog 执行 flush 操作，默认 30 分钟一次，或者 translog 太大也会执行。

手动执行flush ：

POST /my-index/_flush

删除和更新

segment 不可改变，所以 docment 并不能从之前的 segment 中移除或更新。

所以每次 commit，生成 commit point 时，会有一个 .del 文件，里面会列出被删除的 document（逻辑删除）。而查询时，获取到的结果在返回前会经过 .del 过滤。

更新时，也会标记旧的 docment 被删除，写入到 .del 文件，同时会写入一个新的文件。此时查询会查询到两个版本的数据，但在返回前会被移除掉一个。

segment 合并

每 1s 执行一次 refresh 都会将内存中的数据创建一个 segment。

segment 数目太多会带来较大的麻烦。每一个 segment 都会消耗文件句柄、内存和cpu运行周期。更重要的是，每个搜索请求都必须轮流检查每个 segment ；所以 segment 越多，搜索也就越慢。

在 ES 后台会有一个线程进行 segment 合并。

refresh操作会创建新的 segment 并打开以供搜索使用。
合并进程选择一小部分大小相似的 segment，并且在后台将它们合并到更大的 segment 中。这并不会中断索引和搜索。
当合并结束，老的 segment 被删除说明合并完成时的活动：
新的 segment 被刷新（flush）到了磁盘。写入一个包含新 segment 且排除旧的和较小的 segment的新 commit point。
新的 segment 被打开用来搜索。
老的 segment 被删除。

物理删除：

在 segment merge 这块，那些被逻辑删除的 document 才会被真正的物理删除。

总结

主要介绍了内部写入和删除的过程，需要了解 refresh、fsync、flush、.del、segment merge 等名词的具体含义。

本文图片转自知乎大佬：@liuzhihang .侵权则删

二狗plus

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
2
评论
Elasticsearch:文档存储

Q1：ElasticSearch为什么是近实时搜索而不是实时搜索？Q1：ElasticSearch为什么是近实时搜索而不是实时搜索？Q2：ElasticSearch分片内部的写入和删除流程？Q3：ElasticSearch的段合并？
复制链接

扫一扫

专栏目录