分享创新:SplitFS - 持久内存的高性能文件系统
SplitFS 是一个专为持久内存(Persistent Memory,PM)设计的文件系统,它旨在减少应用程序访问持久内存时的软件开销。这个项目由 UTSAS Lab 推出,并基于 NVSL 的 Quill 实现,提供了一种新颖的职责分离机制——在用户态库文件系统和内核态的 PM 文件系统之间。这一独特架构允许用户态处理数据操作,而元数据操作则交由内核进行。
技术深入分析
SplitFS 引入了称为 "relink" 的新原语,以高效支持文件追加和原子数据操作。它提供了三种一致性模式,让不同应用可以根据自身需求选择,而无需相互干扰。通过拦截 POSIX 调用并直接使用处理器加载和存储来服务读取和覆盖,SplitFS 在用户态实现了数据操作,从而显著降低了软件开销。
SplitFS 的实现建立在 Quill 之上,利用其跟踪应用程序请求的 glibc 调用,并为这些调用提供自定义实现。通过 LD_PRELOAD,在运行时拦截调用并将它们转发给 SplitFS。
应用场景与优势
SplitFS 非常适合于对性能有高要求且需要访问持久内存的应用。例如,数据库系统(如 LevelDB 和 SQLite)、版本控制工具(如 Git)、归档工具(如 tar),以及数据同步工具(如 rsync)。在数据密集型工作负载下,SplitFS 表现出色,性能比现有文件系统(如 ext4 DAX、NOVA-strict 和 PMFS)更优,而对于元数据密集型任务,虽然会有一些额外开销,但总体上依然保持高效。
项目特点
-
低软件开销: SplitFS 尽可能接近硬件提供的最大性能,相比 NOVA 或 ext4 DAX 等现有的文件系统,软件开销降低了 4 到 12 倍,甚至可以提高某些应用的性能达 2 倍。
-
灵活保证: 它是唯一允许同时运行的应用程序从文件系统中获得不同保证的持久内存文件系统。SplitFS 提供的三种模式(POSIX、Sync 和 Strict)可以让应用按需选择。
-
可移植性和稳定性: SplitFS 使用 ext4 DAX 作为内核组件,因此可在任何支持 ext4 DAX 的内核上运行。这确保了代码的成熟性和未来性能提升的潜力。
开始使用 SplitFS
在 Ubuntu 16.04 或 18.04 上,你需要满足特定的系统要求,包括至少 32GB 内存、四个核心和一个支持特定指令集的Intel处理器。然后,按照 README 中的步骤安装依赖并设置 SplitFS,通过 LD_PRELOAD 载入 SplitFS 库即可运行应用。
SplitFS 仍在积极开发中,目前仅处理部分系统调用,但计划在未来支持更多的调用以扩展兼容的应用范围。已经测试并通过的工具包括 LevelDB、SQLite(TPCC)、Redis、git、tar、rsync、Filebench、LMDB 和 FIO。
最后,SplitFS 获得了 PJD POSIX 测试套件的全面通过,证明了其实现的稳健性。
加入 SplitFS 的行列,体验高性能持久内存编程的新时代,享受其带来的速度与效率。如果你有任何问题或反馈,欢迎联系 rak@cs.utexas.edu 或 vijayc@utexas.edu。