浅析日志结构的存储引擎(2)-SSTable和LSM-Tree

最新推荐文章于 2023-10-10 16:27:08 发布

带鱼兄

最新推荐文章于 2023-10-10 16:27:08 发布

阅读量892

点赞数

分类专栏：数据密集型应用系统设计-读书思考

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/daiyudong2020/article/details/104706867

版权

数据密集型应用系统设计-读书思考专栏收录该内容

6 篇文章 0 订阅

订阅专栏

基于上一篇文章，我们已经知道了日志结构的存储引擎-bitcask的基本原理。在这个基础上，继续讨论SSTable(Sorted String Table)。

回顾一下bitcask的key-value，它在段文件中是无序的，假设按key排序，并且要求每个key在每个段中只能出现一次，排好序再写入到段文件中，这种格式的段文件称之为SSTable。

一、SSTable比bitcask有什么优点？

1，由于key在一个段中只出现一次且有序，可以使用类似合并排序的方式，在段文件合并时，即使文件大于可用内存也可简单高效合并。如下图：

2，在文件中查找特定key时，不再需要在内存中保存所有key的索引，假设正在查找key-handiwork，且不知道该key在段文件中的准确偏移量。但是知道key-handbag和key-handsome的偏移量，考虑到key是有序的，只需要从handbag扫描到handsome，假设key存在，就能找到。这是稀疏索引的一种设计思路。通常对于段文件中的每几千字节，只需要一个key就足够了。如下图

二、如何构建和维护SSTable？

1，当写入时，在内存中维护平衡树结构，用于key-value排序，当这个树内存大于某个阈值(通常为几M)时，将其作为SSTable文件写入磁盘。由于树已经维护了按key排序的key-value对，写磁盘可以很高效。当SSTable写入磁盘的同时，写入可以继续添加到一个新的内存表。

2，为避免数据库崩溃时，最近写入到内存但还没落地到磁盘的数据丢失，在数据写入内存表前，先在日志文件中追加写该数据，每当内存表写入段文件时，该日志文件就可以被丢弃。否则就用该文件恢复崩溃时丢失的数据。

3，为了处理读请求，首先尝试从内存读取，然后从最新的段文件读到最旧的段文件。当一个key不存在时，这种扫描算法就很慢。为了优化这种访问，维护一个额外的布隆过滤器，如果key不存在布隆过滤器中，那么key肯定不存在。

4，同样类似bitcask，后台进程周期性合并段文件。

三，基于合并和压缩排序文件原理的存储引擎，通常都被称为LSM-Tree。如leveldb、RocksDB都是基于LSM-Tree的思想实现。受到了google的bigtable论文的启发。

参考《数据密集型应用系统设计》

原文出自：https://blog.csdn.net/daiyudong2020/article/details/104706867

End；

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
浅析日志结构的存储引擎(2)-SSTable和LSM-Tree

基于上一篇文章，我们已经知道了日志结构的存储引擎-bitcask的基本原理。在这个基础上，继续讨论SSTable。回顾一下bitcask的key-value，它在段文件中是无序的，假设按key排序，并且要求每个key在每个段中只能出现一次，排好序再写入到段文件中，这种格式称之为SSTable。一、SSTable比bitcask有什么优点？1，由于key在一个段中只出现一次，可以使用类似...
复制链接

扫一扫

专栏目录

带鱼兄

CSDN认证博客专家 CSDN认证企业博客

码龄13年

263: 原创

1万+: 周排名

44万+: 总排名

178万+: 访问

: 等级

1万+: 积分

242: 粉丝

364: 获赞

115: 评论

1148: 收藏

私信

关注

热门文章

分类专栏

数据密集型应用系统设计-读书思考 6篇
TCP/IP 33篇
Redis 30篇
linux之文件操作 22篇
linux之进程操作 23篇
linux之线程操作 16篇
linux之信号操作 2篇
linux之IPC 12篇
linux 37篇
数据结构与算法 16篇
网络安全 10篇
shell 33篇
高可用 19篇
UDP 3篇
HTTP 9篇
云存储 2篇
mysql 20篇
nginx 8篇
openresty 9篇
ELK 8篇
docker 4篇
consul 1篇
fastdfs 2篇
ansible 1篇
memcached 1篇
c/c++ 1篇
python 4篇
java 12篇
php 1篇
杂谈 6篇

最新评论

/sbin/mount.vboxsf: mounting failed with the error: No such device
marx12345: 其他方法都不行，只有这个方法才成功了
套接字和文件描述符
ckj2021: 套接字和文件描述符是两个不对等的概念，怎么能放一起讨论呢？套接字是通信端点的抽象，系统通过套接字描述符访问套接字，正如通过文件描述符访问文件一样。“套接字描述符在UNIX系统中被当作一种文件描述符，事实上，很多用于处理文件描述符的函数（read,write等）都可以用来处理套接字描述符” ----《UNIX环境高级编程》
磁盘util高问题排查
水木一方: 这个结论下的是不是有点草率了
centos7 man手册更新
北海: 确实可以
top命令按内存和cpu排序
会瞬移的猪: 不戳，好用爱用

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。