高性能网络SIG月度动态:自研 IPPROTO_SMC 贡献 Linux 社区,virtio 增加多项优化

高性能网络 SIG(Special Interest Group) :在这个万物互联的时代,云上的网络通信效率对各种服务至关重要,高性能网络兴趣组致力于利用 XDP、RDMA、VIRTIO 等新高效通信技术,结合软硬件一体化的思想,打造高性能网络协议栈,提升云计算时代数据中心应用的网络性能。

一、整体进展

本月高性能网络 SIG 的主要工作聚焦在 ANCK virtio 以及 SMC 上。

本月关键进展

1. ANCK 5.10 内核 virtio-net 新增支持设备状态统计、control vq timeout 和队列重置能力,并优化了控制通道性能。

2. SIG 将自研的 IPPROTO_SMC 方案贡献给上游社区,目前已经获取 Linux 社区认可。

二、ANCK 通用内核网络协议栈

修复

ANCK 5.10 修复 inet_diag() 中潜在数据竞争的问题 (RP3173),预计随着 017 版本发布。

三、SMC

本月 SIG 在 SMC 上的工作主要聚焦于推动 IPPROTO_SMC 方案进入上游主线以及缺陷修复。

IPPROTO_SMC

IPPROTO_SMC[1] 是 SIG 为 IP 协议族新增的一个协议类型。当用户创建 socket 时,IPPROTO_SMC 用来指示底层网络通信应该使用 SMC 协议,其和 IPPROTO_TCP/IPPROTO_UDP 同级。引入 IPPROTO_SMC 旨在提高 SMC 和 TCP 在功能上的一致性,使 SMC 回退到 TCP 协议后在功能路径上与 TCP 仍然保持一致。基于 IPPROTO_SMC,SMC 能够应用几乎所有为 INET 路径创建的 ebpf 功能,使得 SMC 可以使用 ebpf 非常细粒度的控制,并灵活地将 TCP 连接切换成 SMC 连接。此外,ANCK 还基于 IPPROTO_SMC 优化了 SMC 的回退性能,使其在回退到 TCP 的场景下性能和直接使用 TCP 的短连性能差距最差情况相差不超过 6%。

缺陷修复

SIG 本月修复了 SMC 引用计数泄漏[2]和 sk_{sndbuf|rcvbuf} [3]相关缺陷。

四、virtio

本月高性能网络 SIG 在 virtio 领域的工作主要聚焦于控制通道性能优化,支持 control vq timeout、设备统计计数和队列重置。SIG 已把这些特性贡献到了 Linux 上游社区,同时本月将这些特性都回合到了 ANCK,这些功能都将随 ANCK-017 发布。

控制通道性能优化

virtio-net 的 control vq 目前只能同时处理一个请求,这在很大程度上限制了控制通道的效率和灵活性。例如,NetDIM(网络中断调节)是一个现代网卡广泛支持的特性,其通过发送队列级的配置请求来提升性能。随着队列数量的增加,需要发送的配置请求数量也会相应增加。因此,请求发送的效率直接影响了 netdim 为 virtio-net 带来的性能提升,这对 virtio-net 控制通道提出了更高的性能要求。为了解决此问题,SIG 使用了更轻量的锁替换 control vq 曾使用的全局 netlink 锁,并引入了异步提交请求的机制,这些改进允许 control vq 同时处理多个请求,显著提升了 virtio-net 控制通道处理并发请求的性能,还帮助 virtio-net 基于 netdim 实现更佳的性能表现。

control vq timeout

虚拟机使用 virtio-net 网卡时,通常借助 control vq 来提交设备配置的请求。为了获取请求的处理结果,虚拟机需要轮询检查 control vq,直到接收到响应。然而,若设备一直未及时回应这些请求,虚拟机的 CPU 便会持续在高负荷下轮询,这种情况甚至可能导致整机完全 Hang 住。为了解决此问题,SIG 引入了 control vq timeout 机制:自驱动发送命令开始计时,如果在 timeout 超时时间内,设备仍未返回任何响应结果,驱动则认为该设备可能已经出现故障,进而标记驱动不应发送更多请求。该 timeout 值以 ANCK 内核模块参数的形式提供,默认值为 7 天。

设备统计计数

virtio-net 设备曾经无法获取后端设备的统计信息,这些信息对于用户来说,在分析和解决网络问题时至关重要,而用户只能通过云厂商自定义接口来获取某些信息。为了解决此问题,SIG 此前在 virtio 社区成功完成了 virtio-net 对device stats的支持。本月,SIG 也为 ANCK 正式支持了这项功能。这意味着用户现在可以通过用户空间 ethtool 命令直接获取 virtio-net 设备上的统计信息,为分析网络环境提供更多有价值的信息。

队列重置

队列重置功能允许虚拟机停止特定队列,回收并重新分配其内存资源,然后重新启用该队列。这一能力使得用户能够根据特定场景的需求,使用用户态 ethtool 工具调整虚拟机的队列尺寸 ,以优化时延性能表现。此外,在加载 XDP 程序时,驱动程序可以利用队列重置功能,清除所有接收队列中的旧缓冲区,以减少因预填充缓冲区格式不匹配导致的少量数据包丢失,确保数据传输的连续性和完整性。

相关链接:

[1][PATCH net-next v6 0/3] Introduce IPPROTO_SMC - D. Wythe

[2][PATCH net v2] net/smc: fix neighbour and rtable leak in smc_ib_find_route() - Wen Gu

[3][PATCH net] net/smc: avoid overwriting when adjusting sock bufsizes - Wen Gu

高性能网络 SIG 主页:

High Performance Network SIG - OpenAnolis龙蜥操作系统开源社区

注:更多龙蜥 SIG 月度动态可点击这里查看。

  • 20
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

OpenAnolis小助手

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值