前面给大家讲解了常见策略配置错误的三种的问题分析方法。本期讲解多进程方式(用户需要启动和卡数对应的进程,以及配置rank_table表。)启动多卡任务失败的案例,主要解决脚本启动方式错误和并行配置启动任务不匹配的问题,欢迎大家一起学习和讨论类似情况。
具体案例请参考下图~
通过十期MindSpore的报错案例讲解,相信大家对常见的报错分类都有一定认识了。报错分析首先需要区分问题场景,像常见的语法错误、算子执行错误、常数策略配置错误等,先完成场景识别,就能避免解决问题时绕远路;再从报错日志入手分析,快速识别问题关键信息,对比代码、配置或者查看官方API文档,明白异常产生的原因,能正确的修改代码或者配置,从而高效解决问题,使自己的程序顺利运行。
下期问题分析总结篇,回顾问题解决方法,高效解决报错。敬请期待。
昇思MindSpore报错案例总结
【MindSpore报错解决地图】常见报错问题和解决方案:
https://www.hiascend.com/forum/thread-0229108045633055169-1-1.html