【网络】DPDK的基本原理|DPDK和RDMA的区别

bandaoyu

已于 2025-03-22 18:44:16 修改

阅读量1w

点赞数 4

分类专栏： RDMA 文章标签： dpdk

于 2021-01-13 20:25:50 首次发布

本文链接：https://blog.csdn.net/bandaoyu/article/details/112588762

版权

RDMA 专栏收录该内容

89 篇文章

订阅专栏

作者bandaoyu,本文随时更新，原地址：https://blog.csdn.net/bandaoyu/article/details/112588762

DPDK和RDMA的区别结论

相同点：

1）两者均为kernel bypass技术，可以减少中断次数，消除内核态到用户态的内存拷贝；

相异点：

2）DPDK是将协议栈上移到用户态，而RDMA是将协议栈下沉到网卡硬件，DPDK仍然会消耗CPU资源；

3）DPDK的并发度取决于CPU核数，而RDMA的收包速率完全取决于网卡的硬件转发能力

4）DPDK在低负荷场景下会造成CPU的无谓空转，RDMA不存在此问题

5）DPDK用户可获得协议栈的控制权，可自主定制协议栈；RDMA则无法定制协议栈

DPDK是Intel主导，提供了基于用户态的数据链路层的功能，可以在上面构建出基于用户态的网络栈。

解决dpdk空转问题的方法：
dpdk有混合模式，poll长时间没有接收到报文情况下，可以切换到中断模式，等到报文中断到来后又切换回pll模式，往复进行减少CPU资源消耗。

DPDK和RDMA的区别详细

（作者：异客z，链接：https://www.jianshu.com/p/09b4b756b833来源：简书）

DPDK

DPDK网络层：

硬件中断->放弃中断流程；

用户层通过设备映射取包->进入用户层协议栈->逻辑层->业务层；

核心技术：

1）将协议栈上移到用户态，利用UIO技术直接将设备数据映射拷贝到用户态

2）利用大页技术，降低TLB cache miss，提高TLB访问命中率

3）通过CPU亲和性，绑定网卡和线程到固定的core，减少cpu任务切换

4）通过无锁队列，减少资源的竞争

优势：

1）减少中断次数；

2）减少内存拷贝次数

3）绕过linux的协议栈，用户获得协议栈的控制权，能够定制化协议栈以降低复杂度；

劣势：

1）内核栈转移至用户层增加了开发成本

2）低负荷服务器不实用，会造成cpu空转（dpdk有混合模式，poll长时间没有接收到报文情况下，可以切换到中断模式减少CPU资源消耗。）

RDMA

网卡硬件收发包并进行协议栈封装/解析，然后将数据存放到指定内存地址，而不需要CPU干预。

核心技术：

协议栈硬件offload

优势：

1）协议栈offload，解放cpu

2）减少了中断和内存拷贝，降低时延

3）高带宽

劣势：

1）特定网卡才支持，成本开销相对较大；

2）RDMA提供了完全不同于传统网络编程的API，一般需要对现有APP进行改造，引入额外开发成本

总结

相同点：

1）两者均为kernel bypass技术，可以减少中断次数，消除内核态到用户态的内存拷贝；

相异点：

2）DPDK是将协议栈上移到用户态，而RDMA是将协议栈下沉到网卡硬件，DPDK仍然会消耗CPU资源；

3）DPDK的并发度取决于CPU核数，而RDMA的收包速率完全取决于网卡的硬件转发能力

4）DPDK在低负荷场景下会造成CPU的无谓空转，RDMA不存在此问题

5）DPDK用户可获得协议栈的控制权，可自主定制协议栈；RDMA则无法定制协议栈

DPDK是Intel主导，提供了基于用户态的数据链路层的功能，可以在上面构建出基于用户态的网络栈。

DPDK的基本原理

原文：DPDK的基本原理_80后IT老飞侠-CSDN博客_dpdk

网络设备（路由器、交换机、网关等）瞬间进行大量的报文收发，往往有专门的NP（Network Process）处理器（如FPGA或ASIC），高效转发报文，只有需要对报文进行深度处理的时候才需要CPU干涉。

但在很多基础设施以CPU为运算核心，往往不具备专用的NP处理器，操作系统也以通用Linux为主，网络数据包的收发处理路径如下图所示：

在虚拟化环境中，路径则会更长

以CPU为核心的系统，包处理任务存在内核态与用户态的切换，以及多次的内存拷贝，系统消耗变大存在很大的性能瓶颈。为了提升在通用服务器（COTS）的数据包处理效能，Intel推出了服务于IA（Intel Architecture）系统的DPDK技术。

DPDK是Data Plane Development Kit的缩写。运行在操作系统的User Space，利用自身提供的数据面库进行收发包处理，绕过了Linux内核态协议栈，以提升报文处理效率。

DPDK是一组lib库和工具包的集合。最简单的架构描述如下图所示：

上图蓝色部分是DPDK的主要组件（更全面更权威的DPDK架构可以参考Intel官网），简单解释一下：

PMD：Pool Mode Driver，轮询模式驱动，通过非中断，以及数据帧进出应用缓冲区内存的零拷贝机制，提高发送/接受数据帧的效率
流分类：Flow Classification，为N元组匹配和LPM（最长前缀匹配）提供优化的查找算法
环队列：Ring Queue，针对单个或多个数据包生产者、单个数据包消费者的出入队列提供无锁机制，有效减少系统开销
MBUF缓冲区管理：分配内存创建缓冲区，并通过建立MBUF对象，封装实际数据帧，供应用程序使用
EAL：Environment Abstract Layer，环境抽象（适配）层，PMD初始化、CPU内核和DPDK线程配置/绑定、设置HugePage大页内存等系统初始化

这么说可能还有一点点抽象，再总结一下DPDK的核心思想：

用户态模式的PMD驱动，去除中断，避免内核态和用户态内存拷贝，减少系统开销，从而提升I/O吞吐能力
用户态有一个好处，一旦程序崩溃，不至于导致内核完蛋，带来更高的健壮性
HugePage，通过更大的内存页（如1G内存页），减少TLB（Translation Lookaside Buffer，即快表） Miss，Miss对报文转发性能影响很大
多核设备上创建多线程，每个线程绑定到独立的物理核，减少线程调度的开销。同时每个线程对应着独立免锁队列，同样为了降低系统开销
向量指令集，提升CPU流水线效率，降低内存等待开销

下图简单描述了DPDK的多队列和多线程机制：