pytorch代码迁移到mindspore时,API的替换问题

问题描述:

问题

pytorch在训练时采用

ptimizer.zero_grad(),

loss.backward(),

optimizer.step()

这三步流程。

我发现mindspore在这里的设计跟pytorch不一样。

想问一下有没有尽可能改动少的一点的修改方案?

解答:

MindSpore的求导类似pytorch的 torch.autograd.grad(链接torch.autograd.grad — PyTorch 1.12 documentation),将梯度与Tensor剥离,grad操作直接返回梯度,因此不需要 optimizer.zero_grad(), loss.backward() 这两个步骤。

由于 Tensor与梯度剥离,无法直接通过 optimizer.step() 进行参数更新,因此,在MindSpore中更新参数的方式为 optimizer(grads),可以参考 https://www.mindspore.cn/docs/api/zh-CN/r1.5/_modules/mindspore/nn/wrap/cell_wrapper.html#TrainOneStepCell 中construct里的写法。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值