【RDMA】13. RDMA之用户态与内核态交互

本文介绍了RDMA技术中用户态和内核态的交互,指出并非所有用户态Verbs API都能完全绕开内核。控制路径上的操作如创建QP、注册MR等需要陷入内核态,而数据路径上的如Post Send则不需要。用户态通过libibverbs与内核通过ABI交互,保证不同版本的兼容性。文章以ibv_open_device(), ibv_reg_mr(), ibv_create_qp()为例,详细阐述了涉及内核态交互的过程。" 107445929,9620654,MySQL用户与权限管理详解,"['数据库管理', 'SQL', 'MySQL权限']
摘要由CSDN通过智能技术生成

原文:https://zhuanlan.zhihu.com/p/346708569

在“RDMA之Verbs”一文中我们说道,Verbs API分为用户态和内核态,分别以ibv_和ib_作为前缀。RDMA技术的最大的优势就在于用户态可以绕过内核,直接控制硬件收发数据,减少了系统调用和内存拷贝次数,所以大部分的RDMA应用都是用户态应用,即使用以ibv_为前缀的用户态Verbs API。

但是并非所有的用户态Verbs API都可以完全绕开内核,本文中我来讲解一下哪些API依赖于内核RDMA子系统(包括驱动),为什么需要依赖内核,以及用户态和内核是如何交互的。

Verbs的分类

IB规范11.1.2.3节中将Verbs的用户分成两种:

一种是能够直接访问OS内部数据和控制RDMA硬件的特权用户,他们能使用所有Verbs;

一种是必须依赖代理来访问OS数据结构的用户层用户,他们只能使用一小部分的Verbs。

翻译成直白点的话,就是内核态的Verbs用户由于拥有最高权限,所以直接访问所有RDMA资源;而用户态的Verbs用户,只能使用部分接口直接与硬件交互,而大部分Verbs API需要通过系统调用等方式进入内核态来完成。

IB规范中的Table 95列出了所有Verbs的实现必要性和需要的用户权限。

实现必要性上,Mandatory表示软件必须支持,其他表示软件可以选择性的支持;

用户权限上,Privileged表示需要特殊权限,User-Level表示仅需要普通权限。

通过观察表格我们可以发现,除了下发WR(Post Send和Post Recv)和获取WC(Poll CQ和Request Completion Notification)这种用于数据交互的接口,以及Bind MW和AH的相关操作,其他所有操作都需要特权,即调用对应的Verbs API都需要陷入内核态。

RDMA软件协议栈

为了便于后文的说明,我们这里以Mellanox的驱动为例,给出RDMA软件栈的粗略架构,以后的文章会更详细的描述这一部分。

首先从上往下看:

用户空间

  • Application
    各种RDMA应用程序(比如perftest)、中间件(比如UCX)等。
  • libibverbs.so
    RDMA软件栈用户态核心动态链接库,作用:
  1. 实现并且向上层应用提供各种Verbs API
  2. 在各种V
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值