MindSpore模型权重功能无法保存更新后的权重

系统环境

硬件环境(Ascend/GPU/CPU): Ascend

MindSpore版本: 2.1.1

执行模式(PyNative/ Graph): 不限

报错信息

2.1 问题描述

使用CANN7.0+MindSpore2.1.1,训练loss收敛后保存模型,发现保存的不是训练之后的模型权重,而是初始权重,如下所示:

初始化权重信息:

Tensor (shape=[6144, 6144], dtype=Float32 , value=

[[ 1.00874314e-02 6. 56688539e-03 -1. 91919804e-02 … 5.64888678e-03 -2. 20796163e-03 4.29333374e-03]

[-1.58290453e-02 -7. 58421593e-05 -4. 00598830e-04 -1.14668552e-02 - 1.13498308e-02  2.55679921e-03]

[ 5.50412433e-03 1. 71776358e-02 -2.33 142842e-02 1.49840652e-03 1.28344800e-02 8.48229043e-03]

[ 5.53949829e-03 -1. 25942379e-02 6.60581887e-03     -8.29280645e-04 -1.08878603e-02 -4.47568891e-04]

[ 1.70315057e-03 3. 48439417e-03 7.81778805e-03   C -7.27706531e-04  7.55816605e-03 -2.24832026e-03]

[ 8.41980707e-03 6. 66081626e-03 -4. 32111416e-03 -1.40487147e-03 - 4.82343137e-03 -4. 50384151e-03]])复制

训练过程中打印的权重信息:

Tensor(shape=[6144, 6144], dtype=Float32, value=

[[ 1.01261148e-02 6. 58480451e-03 -1. 90741140e-02      5.70917921e-03 -2. 18650815e-03   4.28082701e-03]

[-1.5771551le-02 -4. 06106119e-05 -3.- 39789083e-04     -1.13997944e-02 1.13531193e-02 2.33310624e-03]

[ 5.52728493e-03 1.71936452e-02 -2. 32268739e-02   1.55355304e-03 - 1.29088536e-02   8.45980365e-03]

[ 5.42893354e-03 -1. 26162879e-02 6.61681918e-03  -8.39053362e-04 -1.09538278e-02 -4.17841686e-04]   1.68025843e-03 3.56728001e-03 7.80858565e-03 .. -8.41747446e-04 7.55744614e-03 -2.15848 139e-03]

[ 8.49595107e-03 6.70013577e-03 -4.35717218e-03   -1.36322062e-03 4.75577544e-03 -4. 33780858e-03]])复制

模型保存的权重信息:

-callbacks begin-

Param: backbone.blocks.0. attention.densel.weight with shape (6144, 6144)

[[ 1.0087431e-02 6.5668854e-03 -1.9 191980e-02  - 5.6488868e-03

-2.2079616e-03 4.2933337e-03]

[-1.5829045e-02 -7 .5842159e-05 -4.0059883e-04 ... -1.1466855e-02

1.1349831e-02 2.5567992e-03]

[ 5.5041243e-03 1. 7177636e-02 -2.3314284e-02  1.4984065e-03

1.2834480e-02 8.4822904e-03]

[ 5.5394983e-03 -1.2594238e-02 6.6058189e-03 ..... -8 .2928065e-04

-1.0887860e-02 -4. 4756889e-04]

[ 1.7031506e-03 3. 4843942e-03 7.8177880e-03 ... -7.. 2770653e-04

7.5581660e-03 -2.. 2483203e-03]

[ 8.4198071e-03 6. 6608163e-03 -4.3211142e-03  .-1.4048715e-03

4.8234314e-03 -4.5038415e-03]]

-callbacks end复制

根因分析

根据上述信息发现最终保存的模型权重还是和初始化权重一样,表示并没有保存到训练之后的权重。

解决方案

升级版本到MindSpore 2.2之后,模型保存可以正常工作。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值