【论文阅读】GearDB: A GC-free Key-Value Store on HM-SMR Drives with Gear Compaction

最新推荐文章于 2024-04-10 17:47:37 发布

想个id好难啊

最新推荐文章于 2024-04-10 17:47:37 发布

阅读量1.3k

点赞数

分类专栏：论文阅读小笔记

本文链接：https://blog.csdn.net/weixin_37802735/article/details/108420136

版权

本文介绍GearDB，一种针对叠瓦式硬盘(SMR)优化的LSM-tree基键值存储(KVS)。通过改进磁盘布局、引入压缩窗口和齿轮压缩算法，解决传统KVS在SMR硬盘上面临的性能和空间利用率问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文介绍了GearDB。SMR driver在顺序写/随机读领域有很大的应用优势。本文的目标在于消除基于SMR drive搭建的LSM-KVS垃圾回收所要的read-merge-write操作造成的开销较大以及造成的存储资源碎片化的问题。GearDB使用三种方式进行优化。下文进行分析。

叠瓦式硬盘：是垂直式硬盘（PMR）的一种延伸。

因受物理极限的限制，磁道宽度（以及写入磁头的尺寸）只能缩小到一定的程度。不同于 PMR 不允许磁道相互重叠的做法，SMR HDD 采用的技术是让数据位循序写入，如其名称所示，磁道会如瓦片般堆叠在另一磁道的部分面积上，借此达到增加磁录密度的目的。同时读取的磁头大小也不相同，这样，读取磁头仍可从磁道上未被覆盖的部分来读取数据。
一旦已写入的数据要编辑或覆盖时，写入磁头并不会直接在既有的磁道上进行磁录，以避免损坏相邻磁道。编辑后的数据会先在磁盘上的空白处写入，原先旧数据的磁道会暂时维持不动。等到 HDD 闲置时才会执行重组机制，将原先磁道上的旧数据位自动擦除，并重新成为可用空间以供新数据写入。
例如在上图之中，zone1中write pointer指向了Sector C+1，当要更新Sector中的内容时候。系统会加载Sectors A,B,C到缓存中，然后更新Sector1的内容最终写回。这样的机制导致严重的写放大，也影响了硬盘本身的性能。
只要将指针指向zone的第一个block就可以将不含有有效数据的zone重新用作empty zone。