【NPU】A800-9000服务器8*Ascend 910 B的HCCS测试

内卷焦虑人士

已于 2024-07-12 15:12:03 修改

阅读量1.5k

点赞数 6

文章标签：昇腾 NPU 人工智能

于 2024-04-19 10:22:39 首次发布

本文链接：https://blog.csdn.net/weixin_46398647/article/details/137955674

版权

本文详细描述了HCCS集合通信带宽数据在AtlasA2系列训练设备中的timeline信息展示，以及在msprof_*.json和hccs_*.csv文件中的汇总，同时提供了测试命令npu-smiinfo-ttopo的结果，展示了NPU间的连接关系。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

HCCS集合通信带宽数据

HCCS集合通信带宽数据timeline信息在msprof_*.json文件的HCCS层级展示

summary信息在hccs_*.csv文件汇总。

支持的型号

Atlas 训练系列产品
Atlas A2训练系列产品

测试命令

npu-smi info -t topo

结果展示

	       NPU0       NPU1       NPU2       NPU3       NPU4       NPU5       NPU6       NPU7       CPU Affinity
NPU0       X          HCCS       HCCS       HCCS       PHB        SYS        SYS        SYS        144-167
NPU1       HCCS       X          HCCS       HCCS       SYS        PHB        SYS        SYS        96-119
NPU2       HCCS       HCCS       X          HCCS       SYS        SYS        PHB        SYS        48-71
NPU3       HCCS       HCCS       HCCS       X          SYS        SYS        SYS        PHB        0-23
NPU4       PHB        SYS        SYS        SYS        X          HCCS       HCCS       HCCS       144-167
NPU5       SYS        PHB        SYS        SYS        HCCS       X          HCCS       HCCS       96-119
NPU6       SYS        SYS        PHB        SYS        HCCS       HCCS       X          HCCS       48-71
NPU7       SYS        SYS        SYS        PHB        HCCS       HCCS       HCCS       X          0-23

Legend:

  X    = Self
  SYS  = Path traversing PCIe and NUMA nodes. Nodes are connected through SMP, such as QPI, UPI.
  PHB  = Path traversing PCIe and the PCIe host bridge of a CPU.
  HCCS = Connection traversing HCCS.
  NA   = Unknown relationship.