AXI Interconnect与直连的详细解析

kanhao100

于 2025-03-27 17:11:39 发布

阅读量590

点赞数 27

分类专栏： HLS 文章标签： fpga开发

本文链接：https://blog.csdn.net/kanhao100/article/details/146566196

版权

HLS 专栏收录该内容

44 篇文章

订阅专栏

AXI Interconnect与直连的详细解析

我们来详细解释一下 AXI Interconnect、直连以及为什么 Xilinx 在 DPU 连接上给出这样的建议。

在这里插入图片描述

1. 什么叫做 AXI Interconnect？

AXI Interconnect（AXI 互联）可以理解为一个AXI 总线上的智能交换机或路由器。它的主要作用是：

连接多个 AXI Master（主设备）到多个 AXI Slave（从设备）：它提供了一种灵活的方式来管理 M 个主设备和 N 个从设备之间的通信（M:N 连接）。
地址解码（Address Decoding）：当一个主设备发起一个传输请求时，Interconnect 会根据请求的地址，判断这个请求应该路由到哪个从设备。
仲裁（Arbitration）：当多个主设备同时想要访问同一个从设备时，Interconnect 会根据预设的优先级或策略（如轮询）来决定哪个主设备先获得访问权，避免冲突。
协议转换（Protocol Conversion，可选）：有时 Interconnect 还能处理不同 AXI 协议版本（如 AXI4, AXI3, AXI-Lite）之间的转换，或者数据位宽（如 32位到 64位）的转换，或者时钟域的转换。
提供缓冲和流水线（Buffering/Pipelining）：为了提高整体吞吐量或帮助时序收敛，Interconnect 内部可能会包含缓冲器或流水线阶段。

简单来说，AXI Interconnect 是一个管理和路由 AXI 总线流量的中间模块，允许多对多的连接。

2. 什么叫做直连（Direct Connection）？

直连，顾名思义，就是将一个 AXI Master 设备的端口直接连接到一个 AXI Slave 设备的端口，没有任何中间逻辑（如 Interconnect）。这是一种**点对点（1:1）**的连接方式。

简单来说，直连就是一根线（一组信号线）从主设备端口直接拉到从设备端口。

3. AXI Interconnect 和直连的区别

特性	AXI Interconnect	直连 (Direct Connection)
连接方式	多对多 (M:N)	点对点 (1:1)
功能	地址解码、仲裁、协议转换、缓冲	纯粹的信号传输
复杂度	较高，内部有逻辑	极低，只是布线
资源消耗	需要 FPGA 逻辑资源 (LUTs, FFs, BRAMs等)	主要是布线资源
灵活性	高，易于连接多个设备	低，受限于端口数量
延迟 (Latency)	较高 (内部逻辑处理、仲裁、缓冲引入)	最低 (信号传输的物理延迟)
性能	可能因延迟增加而受限	通常最高 (对于延迟敏感的应用)

4. 为什么 Xilinx 对 DPUCZDX8G 给出这样的建议？

现在我们结合 Xilinx 的文档来理解这些建议：

DPU 的特性：
- DPU 是高性能计算单元，对数据访问延迟非常敏感。
- 它有多个 Master 接口：1个用于取指令（低带宽），2个用于读写数据（高带宽）。这些接口都需要访问 PS 控制的 DDR 内存。
Interconnect 的影响：
- 文档明确指出：“通过 Interconnect IP 传输数据时，数据传输延迟将增大。由 Interconnect 引发的延迟将降低 DPUCZDX8G 性能。”
- 这是因为 Interconnect 内部的地址解码、可能的仲裁等待、缓冲等步骤都需要时间，增加了 Master（DPU）和 Slave（DDR 控制器接口）之间的通信往返时间。
直连的优势：
- 文档建议：“只要 PS 上有足够的 AXI 从端口可用，DPUCZDX8G 中的每个主接口都通过直接连接来连接到 PS…”
- 这是因为直连的路径最短，延迟最低。对于 DPU 这种需要频繁、快速访问 DDR 的 IP 来说，低延迟意味着高效率和高性能。DPU 等待数据的时间越短，它能处理的运算就越多。
资源限制与折衷策略：
- Zynq UltraScale+ MPSoC 上的 PS 端 AXI 从端口（如 S_AXI_HP0~3_FPD, S_AXI_HPC0~1_FPD, S_AXI_LPD）数量是有限的。
- 当 DPU 核数量较多时，所有 DPU 的 Master 端口总数可能超过 PS 提供的可用 Slave 端口数。这时就无法避免使用 Interconnect。
- Xilinx 建议的策略是：
  - 区分优先级： DPU 的数据端口（M_AXI_DATA0/1）是高带宽、性能关键的，应优先考虑直连到 PS 的高性能端口（HP, HPC）。
  - 合并低带宽： DPU 的指令端口（M_AXI_INST）是低带宽的，对延迟相对不那么敏感。可以将多个 DPU 的指令端口通过一个 Interconnect 连接到 PS 的一个低性能端口（如 S_AXI_LPD）。这样既节省了高性能端口，又因为指令访问带宽要求不高，性能损失相对较小。
  - 优先级映射： 如果必须通过 Interconnect 连接数据端口，或者直连时端口选择有限，建议将编号较小（优先级较高）的 DPU 连接到编号较小（优先级较高）的 PS 端口（例如 DPU0 -> HP0）。这通常与 PS 内部对这些端口的访问优先级或性能特性有关。
  - 共享端口： 如文档例子所示，当端口实在不够时，可以将多个数据端口（如 DPU1 的两个数据口，或 DPU2 的数据口加上 SFM 口）通过 Interconnect 连接到同一个 PS Slave 端口（如 HP3 或 HPC0）。此时 Interconnect 会负责仲裁这些 Master 对共享 Slave 端口的访问。这会引入延迟和潜在的带宽瓶颈，是不得已的选择。

总结你的疑惑：

AXI Interconnect 是什么？ 是一个 AXI 总线上的 M:N 连接器/路由器/交换机，提供地址解码和仲裁等功能。
和直连有什么区别？ 直连是 1:1 的点对点连接，无中间逻辑，延迟最低；Interconnect 是 M:N 连接，有内部逻辑，会引入额外延迟。
为什么 Xilinx 这么建议？ 因为 DPU 对访问 DDR 的延迟非常敏感，延迟直接影响 DPU 的运行性能。直连延迟最低，性能最好。当 PS 端口不足时，才不得已使用 Interconnect，并采用优先保证数据端口直连、合并指令端口到 Interconnect 的策略，以尽可能减少性能损失。

在这里插入图片描述