- 博客(1)
- 收藏
- 关注
原创 DDPG多目标优化,求助!
为什么我用DDPG去做一个多目标优化,然后训练步数是3000步的时候critic是下降的,action的值也有变化,可是步数越大critic就上升了,然后action全部输出边界值。有没有哪位大佬能指点一下。
2024-03-16 12:55:17 114 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
为什么我用DDPG去做一个多目标优化,然后训练步数是3000步的时候critic是下降的,action的值也有变化,可是步数越大critic就上升了,然后action全部输出边界值。有没有哪位大佬能指点一下。
2024-03-16 12:55:17 114 1
TA创建的收藏夹 TA关注的收藏夹
TA关注的人