1. 系统环境
硬件环境(Ascend/GPU/CPU): Ascend
执行模式:静态图
Python版本:3.7
操作系统平台:Linux
2. 报错信息
2.1 问题描述
Hccl ops kernel builder is null, may not be inited.
复制
2.2 报错信息
[CRITICAL] HCCL_ADPT(423,ffffbaa9f010, python):2023-02-01-16 [mindspore/ccsrc/plugin/device/ascend/hal/hccl_adapter/hccl_adapter.cc:289] CalcWorkspaceSize] Hccl ops kernel builder is null may not be inited.
[CRITICAL] DEVICE9423, ffffbaa9f010,python):2023-02-01-16 [mindspore/ccsrc/plugin/device/ascend/hal/hardware/ascend_kernel_executor.cc:208] PreprocessBeforeRunGraph] Preprocess failed brfore run graph 3. Framework Error Message: Hccl ops kernel builder is null, may not be inited.
复制
3. 根因分析
代码单P可以跑通,分布式报以上错误,从报错信息可以看到是因为没有初始化通信服务需要的分布式后端。
4. 解决方案
在代码里面加上
init()