SpanDB: A Fast, Cost-Effective LSM-tree Based KV Store on Hybrid Storage

SpanDB: A Fast, Cost-Effective LSM-tree Based KV Store on Hybrid Storage

Key-Value (KV)存储支持许多重要的应用和服务。它们可以进行快速的内存处理,但仍然经常受到I/O性能的限制。最近出现的高速商品NVMe固态硬盘推动了newKV系统设计,利用其超低延迟和高带宽的优势。同时,切换到全新的数据布局并将整个数据库扩展到高端ssd需要相当大的投资。 

作为妥协,本文提出SpanDB,一种基于lsm树的KV存储,适用于流行的RocksDB系统,利用选择性部署高速ssd。SpanDB允许用户将大量数据存储在更便宜、更大的SSD上,同时将预写日志(WAL)和lsm树的顶层重新定位到更小、更快的NVMe SSD上。为了更好地利用这种快速磁盘,SpanDB通过SPDK提供了高速、并行的WAL写,并支持异步请求处理,以减轻线程间同步开销,并高效地工作在基于轮询的I/O中。实验结果表明,SpanDB同时将RocksDB的吞吐量提高了8.8⇥,将延迟降低了9.558.3%。与高端ssd系统KVell相比,SpanDB以更低的存储配置实现了96 ~ 140%的吞吐率,降低了2.3 ~ 21.6⇥的延迟 

一背景:

1. 最近的快速商品NVMe ssd的可用性可以带来戏剧性的KV性能提升,最近的系统,如KVell[46]和KVSSD[40]证明了这一点。

2. 当前基于lsm树的KV存储未能充分利用NVMe ssd的潜力。

3. 新的NVMe接口带有访问限制(例如需要将整个设备绑定以进行SPDK访问,或者建议将线程固定到核心上)。这使得KV设计复杂,无法使用高端ssd处理不同类型的KV I/O,也降低了当前常见的同步请求处理的效率。

4)像Optane这样的顶级ssd对于大规模部署来说是昂贵的。由于大型的、写密集型的KV存储不可避免地会占用大量的冷数据,将所有数据存储在这些相对较小且昂贵的设备上可能超出了用户或云数据库服务提供商的预算。

二研究内容

本文提出了一种基于LSMtree的KV系统SpanDB,该系统部分部署了高端NVMe固态硬盘。它基于将流行的KV存储移植到SPDK I/O (sec2)的瓶颈/挑战的全面分析,并包含以下创新:

•通过合并一个相对较小但速度较快的磁盘(SD),它扩展了对最新数据的所有写和读处理,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值