MindSpore版本:1.2.0
cann:5.0.1.spc1.2
模型:bert
场景:使用两个形同bert模型对两个词语或短句进行相似度匹配
问题:模型跑起来以后aicore资源利用率为0,并且训练一个batch需要花60s以上的时间,如下图
说明:代码基本都是自己实现,没有参照码云仓bert模型实现,只有在前向梯度累加部分完全复用MindSpore官网代码,链接:https://www.mindspore.cn/tutorial/training/zh-CN/r1.2/advanced_use/apply_gradient_accumulation.html
主要原因还是代码的问题,由于前向使用的是官网提供的梯度累加的代码,直接改为封装好的api,model.train问题解决