KVIMR: Key-Value Store Aware Data Management Middleware for Interlaced Magnetic Recording...——论文泛读

ATC 2021 Paper 论文阅读笔记整理

问题

基于日志结构合并树(LSM-tree)的键值(KV)存储系统在硬盘驱动器(HDD)上为写入密集型应用提供了高吞吐量。新兴的交错磁记录(IMR)技术,使得基于IMR的HDD成为构建经济高效的KV存储系统的另一个理想选择,因为它具有高面积密度。然而,在IMR基础的HDD上部署基于LSM-tree的KV存储系统可能导致传入读/写的吞吐量明显下降。

挑战

IMR布局中,任何顶部轨道都可以自由更新,而对底部轨道的更新将在其两个相邻的顶部轨道上引入最多两个轨道重写。为了在确保崩溃一致性的情况下进行磁道重写,提出了读-修改-写(RMW)方法[25]。

在基于IMR的HDD上部署基于LSM树的KV存储,可能会显著降低传入读/写的吞吐量。原因是基于IMR的HDD的RMW过程会放大由压缩过程引入的背景I/O,而这种放大的背景I/O可能会降低压缩过程的效率,并进一步降低传入读/写的吞吐量[9,39,53]。

本文方法

本文提出了KVIMR,在基于IMR的HDD上构建基于LSM-tree的KV存储系统,保持经济高效且高吞吐量。KVIMR为中间件,插入在基于LSM-tree的KV存储系统和基于IMR的HDD之间,以保持对主流LSM-tree KV存储系统的兼容性,并进行有限的修改。

  • 采用了压缩感知的路径分配方案:在保持数据文件(即SSTables)同时最小化耗时的RMW;在压缩过程中有效地访问数据文件,补救了吞吐量下降,并提高了压缩效率。

  • 利用了合并RMW方法,以提高将KV存储系统的多路文件持久化到IMR路径的效率,其关键思想是将多个逐轨RMW重新排序为一个合并的RMW,同时仍确保崩溃一致性。

评估显示,KVIMR在写入密集型工作负载下,将整体吞吐量提高了高达1.55倍,在HDD的高空间使用率下,实现了2.17倍的吞吐量。

实验

实验环境:仿真方法[39],用基于CMR的HDD(型号ST500DM002[1])来仿真100 GB的IMR HDD。

数据集:YCSB[14]

实验对比:吞吐量、压缩时间、IMR重写数量、同步调用数量

总结

针对基于IMR的HDD上的基于LSM-tree的KV存储优化。作者提出KV存储和HDD间的中间件:采用了压缩感知的路径分配方案,在保持数据文件(SSTables)同时最小化耗时的RMW,在压缩过程中有效地访问数据文件,补救了吞吐量下降,并提高了压缩效率;利用了合并RMW方法,以提高将KV存储系统的多路文件持久化到IMR路径的效率,其关键思想是将多个逐轨RMW重新排序为一个合并的RMW,同时仍确保崩溃一致性。

  • 25
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

妙BOOK言

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值