【报告整理】持久内存存储系统研究

报告探讨了在高速硬件如NVM和RDMA网络下,传统存储面临的软件效率低下问题。主要挑战包括软件栈开销、操作系统开销、持久化开销和分布式协议开销。解决方案包括Octopus的客户端主动式I/O、KucoFS的用户/内核态协同文件系统、FlaStore的批量处理技术和Concordia的在网分布式协议。这些技术旨在提高带宽利用率、降低延迟并优化分布式协议效率。
摘要由CSDN通过智能技术生成


报告人:清华大学 陆游游
报告连接https://www.bilibili.com/video/BV13P4y1M72t?spm_id_from=333.999.0.0

背景

  • 数据存储的需求:
    • 数据量大、实时要求高
    • 尤其体现在新型应用上:高带宽、低延迟、性能稳定
  • 内存存储系统:数据存储的高性能需求催生而来
  • 新型网络设备
    • NVM(延迟:几百纳秒量级)
    • RDMA(延迟:1微秒量级):绕过内核,减少拷贝,远端的CPU不参与直接访问远端内存
  • 硬件带来新机遇:持久性内存
    • Intel 3D-Xpoint
      • 内存模式(Memory Mode):超大容量内存、容易使用
      • 应用直访模式(App Direct Mode)——(不容易丢失,所以持久性通常在此模式下):操作系统将其作为独立存储设备、应用直接访问
  • 更大的挑战:软件效率问题

传统存储的挑战

测试结果

测试结果
——对于现在高速硬件来说,现在的软件占了延迟的大部分,对于带宽的利用率很低。

4个主要挑战

  • 软件栈开销
    • 存储架构:层次结构导致软件栈臃肿(数据在拷贝)
    • 持久性内存和高速网卡:数据直访
  • 操作系统开销
    • 存储软件:操作系统管理数据开销大(锁的存在限制了多核的性能)
    • 持久性内存Load/Store指令直访
  • 请求持久化开销
    • 传统存储软件:产生大量小写,造成持久化效率低
    • 持久性内存:写带宽有限
  • 分布式协议开销
    • 高速网络:具有一定可编程能力
    • 传统存储协议:网络视作黑盒

工作内容

Octopus:软件栈开销

  • 基于RDMA的分布式持久性共享内存池
    RDMA

  • 如何减少拷贝?客户端可以通过RDMA直接读写文件系统数据

  • 如何高效I/O?

    • 原来:服务器主动式I/O(适用于慢速以太网,在高速硬件下,CPU很容易成为瓶颈)
    • 改为:客户端主动式I/O(客户端从分布式持久性共享内存中直接读写数据)

KucoFS:操作系统开销

  • 用户/内核态协同文件系统
    • 元数据管理技术
      • DRAM+NVM混合内存元数据管理,解决元数据的扩展性
      • 功能卸载
      • 批量处理
    • 数据管理技术
      • 用户态锁管理
      • 乐观读

FlaStore:持久化开销

网络存储协同的批量处理技术。

Concordia:分布式协议开销

  • 在网分布式协议(缓存一致性)
    • 利用可编程交换机的高性能和中心化
    • 利用交换机对缓存一致性请求进行串行化和多播

总结

背景问题:我们需要从硬件满、软件复杂转换为硬件快、软件高效。

  1. 软件栈;
  2. 体系结构适配:CPU缓存的行、刷新粒度匹配问题等;
  3. 操作系统设计:存储上、网络上;
  4. 分布式协议设计:机器之间互相发送消息占用的效率。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

随处可见的打字员

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值