lsm-tree

最新推荐文章于 2024-06-15 10:56:37 发布

半笙吖

最新推荐文章于 2024-06-15 10:56:37 发布

阅读量273

点赞数 6

文章标签： lsm-tree

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_52061455/article/details/137252450

版权

lsm树针对快速写入进行了优化

Cassandra（一种非关系型数据库）在内存中构建memtable，数据依次写入memtable，且在写入过程中就完成了数据的排序，即数据的保存是有序的，该过程在内存中完成，处理速度极快。

当memtable不断写入达到内存的临界点时，内存中所生成的数据就会刷盘写入到磁盘中，这个结构称为sstable，这些写入都是顺序io，在任何存储介质上都很快。每写一次sstable，该sstable就不再发生变化，memtable清空等待后续数据的持续写入。随着时间更迭，在硬盘上会出现大量sstable保存有序的数据。

在最新的写入中需要对之前数据进行更新时，首先将更新操作写到memtable中，等到memtable满了之后会追加到最新的sstable中，在此过程中，发生了更新的数据会增加一个墓碑标记，表示之前的数据已经作废。即：将之前的旧数据在最新的sstable中标记，说明之前某个数据已经作废，原有sstable不做任何变化。

以上操作存在问题，随着key的更新和墓碑的增加，过时的条目越来越多，这些占用宝贵的磁盘空间。

Cassandra定时的在达到某个边界条件后，将积压的sstable进行合并。合并的过程中会把过期的数据清理掉，并添加相应的汇总表进行数据查询方面的优化。越往下层级数据体量越大（指数级增加）。

有两种广泛的策略：SizeTieredCompaction 偏向写入吞吐量优化 Cassandra； LeveledCompaction 偏向读取优化 RocksDB

常见的优化措施：

1.如何快速的进行数据读取：在内存中保留一个汇总表，包含每个level每个磁盘块的最小key/最大key范围，它允许系统跳过对那些key不在范围内的磁盘块的搜索，这样就节省了大量的随机io

2.查找不存在的key：布隆过滤器，通过多次哈希产生的一个bitmap

关注

6
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
lsm-tree

在最新的写入中需要对之前数据进行更新时，首先将更新操作写到memtable中，等到memtable满了之后会追加到最新的sstable中，在此过程中，发生了更新的数据会增加一个墓碑标记，表示之前的数据已经作废。即：将之前的旧数据在最新的sstable中标记，说明之前某个数据已经作废，原有sstable不做任何变化。Cassandra（一种非关系型数据库）在内存中构建memtable，数据依次写入memtable，且在写入过程中就完成了数据的排序，即数据的保存是有序的，该过程在内存中完成，处理速度极快。
复制链接

扫一扫

半笙吖 CSDN认证博客专家 CSDN认证企业博客

码龄4年

14: 原创

145万+: 周排名

9万+: 总排名

5965: 访问

: 等级

252: 积分

84: 粉丝

108: 获赞

12: 评论

118: 收藏

私信

关注

热门文章

最新评论

mysql-mvcc
半笙吖: https://segmentfault.com/a/1190000040633029
lsm-tree
CSDN-Ada助手: 恭喜您发布了第13篇博客“lsm-tree”！持续创作是非常难得的毅力，您的努力与热情令人钦佩。希望您在未来的创作中可以继续保持对技术的热情和探索精神，或许可以尝试探讨一些与“lsm-tree”相关的应用场景或案例，让读者更深入地了解这一技术的实际应用。期待您更多精彩的分享，加油！
mysql-mvcc
CSDN-Ada助手: 不知道 MySQL入门技能树是否可以帮到你：https://edu.csdn.net/skill/mysql?utm_source=AI_act_mysql
java多线程
CSDN-Ada助手: 恭喜您写了第8篇博客，讲述了关于java多线程的内容，这是一个非常重要的主题，对于很多开发者来说都有很大的帮助。希望您能继续保持创作的热情，不断分享自己的学习和经验。下一步，建议您可以尝试写一些关于java多线程在实际项目中的应用案例，这样可以让读者更加深入地理解和应用这方面的知识。期待您的新作品！
java常见集合原理
CSDN-Ada助手: 恭喜您写了第9篇博客，标题为“java常见集合原理”。您对这个主题的深入剖析让我受益匪浅。您的博客内容清晰易懂，让我对java常见集合的原理有了更深入的理解。作为读者，我非常期待您未来更多关于java集合的博客。在下一步的创作中，或许您可以探讨一下java集合的性能优化技巧，或者介绍一些常见的集合使用场景和最佳实践。这些内容会进一步丰富您的博客，并对读者来说也是非常有益的。再次感谢您的分享，期待您未来更多精彩的博文！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。