Mindspore 1.5rcGraph Mode训练速度慢，这是为什么？

最新推荐文章于 2024-07-22 20:09:49 发布

昇思MindSpore

最新推荐文章于 2024-07-22 20:09:49 发布

阅读量336

点赞数

分类专栏：技术博客文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Kenji_Shinji/article/details/125206929

版权

技术博客专栏收录该内容

416 篇文章 55 订阅

订阅专栏

问题描述：

【背景信息】

整个Model是一个文字识别任务，包含CNN，Transformer，Loss只有一个CrossEntropy的分类loss。

【问题描述】

整个代码已经在PyNative模式下顺利运行，并且训练到了很高的性能。

训练输入是batchsize=64的160x48的图片。输出类别数为7000左右。

单卡单机，PyNative下训练，每个Batch平均需要3秒左右

现在拿在PyNative模式下训练好的Model，load进来以后切换成GRAPH Mode继续finetune，发现精度几乎一致，没有下降，但是速度慢了一大截！比PyNative模式，每个batch慢了10倍左右的时间！

解答：

应该是图重复编译了，dict，list,tuple都不要作为根图的入参，因为graph是有编译缓存的，tensor作为入参时，是把shape和type看做是key的，其他类型都是要看object的属性和value的，如果传入一个dict可能导致某些value一直在变，导致图缓存不下来，每个step都在编译图，时间会大大增加。

昇思MindSpore

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Mindspore 1.5rcGraph Mode训练速度慢，这是为什么？

问题描述：【背景信息】整个Model是一个文字识别任务，包含CNN，Transformer，Loss只有一个CrossEntropy的分类loss。【问题描述】整个代码已经在PyNative模式下顺利运行，并且训练到了很高的性能。训练输入是batchsize=64的160x48的图片。输出类别数为7000左右。单卡单机，PyNative下训练，每个Batch平均需要3秒左右现在拿在PyNative模式下训练好的Model，load进来以后切换成GRAPH Mode继续finetune，发现精度几乎一致，没有
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。