Leveldb-SSTable

最新推荐文章于 2023-02-04 12:36:30 发布

炸毛疯兔

最新推荐文章于 2023-02-04 12:36:30 发布

阅读量351

点赞数

分类专栏： LevelDB 文章标签：服务器数据库 leveldb

本文链接：https://blog.csdn.net/qq_52245648/article/details/127067941

版权

LevelDB 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

SSTable

终于开始看SSTable的设计了👀，在这里记录一下我觉得比较亮眼的地方

SSTable: Sorted String Table, 作为存储在磁盘上面的数据，有序是必要的，这样我们查询的时候会更快。

当memtable中的数据超过一定的阈值之后就会转换为immutable memtable，后台线程会将immutable按照SSTable的格式写入到磁盘上面。这里多提一嘴：什么时候我们可以进行 异步操作？之前看Redis中的 非关键路径 那么就可以开一个线程帮我们完成，实现异步操作。非关键路径也就是我们 不需要立即返回操作得到的结果，可能是返回一个我已经做了的状态，总之就是不要求马上返回结果，那么我们就可以开一个子线程去操作来避免阻塞我们的主线程。

SSTable的文件格式

请添加图片描述

按照功能进行划分的话可以分成几个区域

Data Block: 实际上存放key/value数据
Meta Block: 存放过滤器和SSTable相关的统计数据
MetaIndex Block : 存放了所有 Meta Block的索引
Index Block: Data Block的索引
Footer: 48Bytes大小，两个Handle标识 metaindex block & index block

Block

想象一下怎么进行key-value数据的存储，最简单的方式就是一个个的将key-value进行有序的存储。

请添加图片描述

shared_bytes：和前一个 key 相同的前缀长度。

unshared_bytes：和前一个 key不同的后缀部分的长度。

value_length：value 数据的长度。

key_delta：和前一个 key不同的后缀部分。

value：value 数据。

Leveldb中做了一个优化：前缀压缩，利用了Key的有序性（也就是前缀相同的会聚集到一起的）

举个例子🌰：记录1的key: abcd, 记录2的key:abce, 那么我们就能够将 相同的前缀部分提取出来，这一部分的内容不用每一个entry都去存储，因为key是有序的，这样其实能够 进行一个显著的提升。

shared key:存储在本组中，每一条entry只要记录下 相同前缀的部分长度就好了，再记录独属于自己部分的key 和 value