roce和iwarp_PhegData核心原力:RDMA的跃进之力

为了解决爆炸式增长的数据存储和读取效率问题,尤其是当前应用无论存储延迟还是高吞吐都有很高要求,传统架构已很难满足需求。利用分布式存储实现多节点横向空间扩展、多节点性能高并发访问越来越受到欢迎。

但也带来了因为节点间数据交互导致存储网络繁忙,一旦因拥塞造成丢包,将会引发IO请求重传,不仅降低效率,还会加重拥塞。同时传统的网络协议栈(如TCP/IP)并不是针对高性能应用场景设计的,因此难以提供高效的通信支持,系统调用和内存复制等操作都会带来巨大的性能开销。

为了降低网络延迟,提高处理效率,RDMA技术应运而生,通过允许用户态的应用程序直接读取和写入远程内存,而无需CPU介入多次拷贝内存,并可绕过内核直接向网卡写数据,实现了高吞吐量、超低时延和低CPU开销的效果。

RDMA是一种通过网络把数据直接传入另一台计算机内存区域的技术,其很少占用CPU资源,不需要进行内存复制,基本可以不需要内核介入数据传输过程。这种数据传输方式可以提供低延时,高带宽和低CPU使用率,最大化的利用网络设备本身的资源,避免各种协议栈的开销,其作为NVMe over Fabric的传输网络非常合适。

RDMA(RemoteDirect Memory Access)技术全称远程直接内存访问,就是为了解决网络传输中服务器端数据处理的延迟而产生的。

它将数据直接从一台计算机的内存传输到另一台计算机,无需双方操作系统的介入。这允许高吞吐、低延迟的网络通信,尤其适合在大规模并行计算机集群中使用。

RDMA通过网络把资料直接传入计算机的存储区,将数据从一个系统快速移动到远程系统存储器中,而不对操作系统造成任何影响,这样就不需要用到多少计算机的处理能力。它消除了外部存储器复制和上下文切换的开销,因而能解放内存带宽和CPU周期用于改进应用系统性能。

目前,大致有三类RDMA网络,分别是Infiniband、RoCE、iWARP。

其中,Infiniband是一种专为RDMA设计的网络,从硬件级别保证可靠传输 。而RoCE 和 iWARP都是基于以太网的RDMA技术,支持相应的verbs接口。在Ethernet以太网上,根据协议栈融合度的差异,分为iWARP和RoCE两种技术,而RoCE又包括RoCEv1和RoCEv2两个版本(RoCEv2的最大改进是支持IP路由),各RDMA网络协议栈的对比如下图所示:

Infiniband,支持RDMA的新一代网络协议。由于这是一种新的网络技术,因此需要支持该技术的Infiniband网卡和交换机,性能体验上最佳。

RoCE,一个允许在以太网上执行RDMA的网络协议。其较低的网络标头是以太网标头,其较高的网络标头(包括数据)是InfiniBand标头。这支持在标准以太网基础设施(交换机)上使用RDMA。需要支持RoCE网络协议的以太网卡才可使用,性能接近Infiniband

iWARP,一个允许在TCP上执行RDMA的网络协议。IB和RoCE中存在的功能在iWARP中不受支持。这支持在标准以太网基础设施(交换机)上使用RDMA,需要支持iWARP特性的网卡才可以使用,对比Infiniband RDMA 和ROCE性能较差

PhegData-X研发团队自研存储引擎SmartStor-X集成RDMA通讯功能,支持通过InfiniBand、RoCE或TCP模式实现计算到存储端、存储节点之间数据传输。

配合自研高性能SmartCache缓存模块、自研高并发块客户端,为客户提供高性能低延迟的理想型分布式存储解决方案。下图为通过Infiniband RDMA方式和以太网TCP方式的性能对比,无论8k场景或1024k场景下随机读写性能RDMA方式对比TCP均要提升一倍左右。

作为分布式存储的新原力,通过软件定义,具有如下特点:

高度的开放兼容性,支持主流X86,申威以及飞腾平台,不受硬件厂商绑定

高性能,Phegdata X通过SSD缓存加速,采用全并发IO引擎,支持IB,万兆上去行,能够提供高性能存储服务

高可靠性,Phegdata X支持多副本,节点或磁盘异常后能够自动重构,具有高可靠性的特点

高扩展能力,Phegdata X采用去中心化架构,支持磁盘和节点扩展,扩展后自动均衡,最大支持4096个节点

面向未来数据中心设计打造的PhegData-X系列同时兼顾传统业务应用,既可以满足数据库等传统核心关键业务需求,也可以完美支持大数据分析、虚拟化、容器、私有云等新型业务应用。

典型应用场景

结合RDMA高速网络解决方案,PhegData-X可以解决客户绝大多数高性能需求场景,保证客户业务高效稳定运行的同时,提升业务的敏捷性与竞争力。

【责任编辑:张燕妮 TEL:(010)68476606】

点赞 0

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
RDMA(Remote Direct Memory Access)是一种数据传输技术,它允许主机之间直接访问彼此的内存,而无需通过操作系统的介入。RDMA可以显著提高数据传输效率和降低处理延迟,常用于高性能计算、存储网络和数据中心等领域。ROCE(RDMA over Converged Ethernet)和Iwarp都是基于RDMA技术的协议,但有一些区别: 1. ROCE(RDMA over Converged Ethernet):ROCE是一种在以太网上实现RDMA的协议。它利用以太网的物理层和数据链路层,通过使用特殊的以太网帧格式和扩展头部来实现RDMA功能。ROCE可以在现有以太网基础设施上实现低延迟、高带宽的数据传输,并且与以太网交换机和路由器兼容。 2. Iwarp:Iwarp是一种在TCP/IP网络上实现RDMA的协议。它通过在TCP/IP协议栈中添加额外的RDMA支持来实现数据直接存取。Iwarp协议需要在操作系统内核中进行实现,因此需要特定的驱动程序和软件支持。由于基于TCP/IP协议,Iwarp可以在现有的IP网络基础设施上使用。 在ROCE和Iwarp之间选择时,需要考虑以下因素: - 兼容性:ROCE和Iwarp在不同的网络基础设施上有不同的兼容性要求。ROCE需要支持特殊的以太网帧格式和扩展头部,而Iwarp需要特定的驱动程序和软件支持。 - 性能:ROCE和Iwarp在性能上可能有所不同。ROCE在以太网上实现RDMA,可以提供较低的延迟和较高的带宽。而Iwarp基于TCP/IP协议,可能受到TCP协议的限制,性能可能相对较低。 - 配置和管理:ROCE和Iwarp在配置和管理方面也有所不同。ROCE可以利用现有的以太网基础设施,配置相对简单。而Iwarp需要特定的驱动程序和软件支持,可能需要额外的配置和管理工作。 最终选择ROCE还是Iwarp取决于具体的应用需求、网络环境以及设备兼容性等因素。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值