首先BMS裸金属服务器配置
- 型号:Atlas800-9000
- CPU: KunPeng920
- NPU: Ascend910 (32G) * 8
- 系统:Euler2.10
配置HCCN环境
- 方法:
使用hccn_tool配置每张卡的IP地址,可参考连接:https://www.hiascend.com/document/detail/zh/canncommercial/63RC2/envdeployment/instg/instg_000044.html
进行配置
hccn_tool -i 0 -ip -s address 192.168.100.101 netmask 255.255.255.0
hccn_tool -i 1 -ip -s address 192.168.101.101 netmask 255.255.255.0
hccn_tool -i 2 -ip -s address 192.168.102.101 netmask 255.255.255.0
hccn_tool -i 3 -ip -s address 192.168.103.101 netmask 255.255.255.0
hccn_tool -i 4 -ip -s address 192.168.100.100 netmask 255.255.255.0
hccn_tool -i 5 -ip -s address 192.168.101.100 netmask 255.255.255.0
hccn_tool -i 6 -ip -s address 192.168.102.100 netmask 255.255.255.0
hccn_tool -i 7 -ip -s address 192.168.103.100 netmask 255.255.255.0
- 查看配置,打开/etc/hccn.conf,可查看到该台机器的多卡配置信息
![hccn.conf配置信息](https://img-blog.csdnimg.cn/71c1a74be49e44efa38be530d3c3d351.png)
配置rank_table
- 下载hccl_tools,下载地址,如下是已经下载的脚本。
![hccl_tools.py脚本](https://img-blog.csdnimg.cn/a603aa435db34460a0739071d45e9ac9.png)
- 执行python hccl_tools.py 生成rank_table.json文件
![生成rank_table文件](https://img-blog.csdnimg.cn/053b5b8eae22446686682d13c58d5c70.png)