DQN算法优化器迁移,loss函数的回调问题

问题描述:

【功能模块】

想把一个基于pytorch的DQN玩flappy bird项目转为mindspore框架

在torch项目中,loss回传如下图

 

参考优化器迁移指南 优化器迁移指南 — MindSpore master documentation

 

改写成下面形式

 

在测试后,发现实际上并没有进行学习。

【操作步骤&问题现象】

1、在改写的封装Model函数中,并没有使用到y_predict 和 y_batch_tensor 生成的loss值,请问要如何修改放入Model函数中,

2、在改写的形式中,是否loss函数并没有回传,应该如何修改才能传回?

具体网络如下

解答:

您好,model init里会把 net loss opt封装成一个大的cell,具体可以参考 withlosscell、trainonestepcell的定义

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值