KVSSD: 结合 LSM 与 FTL 以实现写入优化的 KV 存储

最新推荐文章于 2023-12-07 12:58:34 发布

青云技术社区

最新推荐文章于 2023-12-07 12:58:34 发布

阅读量903

点赞数

文章标签：云计算云存储

本文链接：https://blog.csdn.net/qingcloudedu/article/details/120412018

版权

本文探讨了KVSSD（Key-Value SSD）的设计，它结合LSM树和Flash Translation Layer（FTL），旨在减少写入放大问题。通过K2P Mapping、Remapping Compaction和冷热分离技术，KVSSD提高了SSD的写入效率和性能。实验证明，KVSSD可以显著降低写放大，提升吞吐量，但可能会增加读取放大。目前，KVSSD的相关指令集已被纳入NVMe 2.0规范，展示了其在工业界的潜力。

摘要由CSDN通过智能技术生成

本次分享的 Paper[1]：《 KVSSD：Close integration of LSM trees and flash translation layer for write-efficient KV store 》是在 18 年的 Design, Automation & Test in Europe Conference & Exhibition (DATE) 会议上出现的 KVSSD，作者为：Sung-Ming Wu[2]、Kai-Hsiang Lin[3]、 Li-Pin Chang[4]。

这篇 Paper 主要思路是在 SSD 上直接提供 KV 接口，将 LSM Tree 与 FTL 深度结合，从而避免从 LSM Tree，主机文件系统到 FTL 多个软件层的写入放大。跟大家分享这篇 Paper ，一方面是蹭一蹭 KV 接口已经成功进入 NVMe 2.0 规范被标准化的热点，另一方面是为了和 TiKV / TiDB 的同学探讨未来存储硬件的更多可能性，希望能带来一些启发。

本文将首先介绍问题的背景，什么是写放大，哪里产生了写放大，然后引出解决方案，介绍 KVSSD 做了哪些优化，之后再介绍 KVSSD 的性能评估数据，以及工业上的进展。

file

背景

首先我们来聊聊背景。这是一个 TiKV 的架构图：

file

我们都知道 TiKV 是一个分布式的 Key-Value 数据库，TiKV 的每一个节点都运行着一个 RocksDB 的实例，就像是这样：

file

RocksDB 基于 Log-structed merge-tree (LSM) 开发的，LSM tree 是目前业界运用最为广泛的持久化数据结构之一。我们要讨论的问题就是 LSM tree 在 SSD 上遇到的写入放大问题及其解决方案。

KV 存储系统中的写放大

从存储的视角来看，一个 KV 存储的软件堆栈大概是这样的：

file

最顶层是一颗 LSM tree，具体的实现就不展开了。大体的思路是在内存中维护可变的 Memtable，在 SSD 上维护不可变的 SSTable。Memtable 写满后会作为 SSTable 输入存储，而所有的 SSTable 会组合成一颗分层的树，每一层写满后就会向下一层做 compaction。LSM tree 维护过程中产生的 IO 会通过文件系统与 BIO 层的转换落到 SSD 上。

file