An Introduction to Be-trees and Write Optimization 学习笔记

最新推荐文章于 2024-08-20 13:24:05 发布

风动蝉鸣

最新推荐文章于 2024-08-20 13:24:05 发布

阅读量465

点赞数

分类专栏：学习笔记文章标签：数据库 mysql 数据结构 nosql

本文链接：https://blog.csdn.net/weixin_42344299/article/details/109631234

版权

本文介绍了Bε-Tree的数据结构，重点讲述了插入、删除和查询操作的优化，强调了缓冲区在性能提升中的作用。Bε-Tree通过批量刷数据和延迟应用消息来减少IO成本，适用于写密集型场景。

摘要由CSDN通过智能技术生成

paper链接：An Introduction to Be-trees and Write Optimization

Be-Tree结构如下：

Be-Tree结构

在B-Tree和Bε-Tree中，内部节点存储枢轴键和子指针，叶节点存储键值对（按key排序）。

问：叶子节点多大？键值对怎么在叶子节点中存储？一个叶子多个键值对？
大小为B的叶子包含B个键值对，下面称之为items
Bε-Tree的区别在于，内部节点还为缓冲区分配了一些空间，每个内部节点中的缓冲区用于存储messages（消息），messages就是编码后的更新操作（插入、删除），这个更新最终将应用于该节点下面的叶子节点中的items（键值对）

问：本文的B-Tree是不是B+Tree，因为感觉所有k-v都保存在叶子，中间节点只做索引

插入操作被编码为插入消息insert messages
寻址到特定key，然后把insert messages添加到根节点的buffer中
当一个节点的buffer填满后，将一批message（符合该孩子的message）刷新到该节点的一个孩子
通常选取具有最多未决消息pending messages的孩子

**快速响应：**这样可以尽快把pending message刷到节点里面去

**分摊IO成本：**这样也可以下刷的时候保证每次写数据量不会太少，数据太少就变成随机小写了
每条message最终都会传递到适当的叶子节点，并将新的k-v添加到叶子
叶节点变得太满时分裂（同B树）
内部节点有太多孩子时分裂（同B树），buffer中的message会在两个新节点间分配

关注