DDPG多目标优化，求助！

dty2.0

已于 2024-03-16 13:01:00 修改

阅读量122

点赞数 3

文章标签： python conda 机器学习神经网络 pytorch 回归深度学习

于 2024-03-16 12:55:17 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_57630474/article/details/136760393

版权

作者在使用深度DeterministicPolicyGradient(DDPG)进行多目标优化时遇到问题：在训练过程中，随着步数增加，critic值先降后升，action输出接近边界值。寻求对这种反常现象的解释和指导。

摘要由CSDN通过智能技术生成

为什么我用DDPG去做一个多目标优化，然后训练步数是3000步的时候critic是下降的，action的值也有变化，可是步数越大critic就上升了，然后action全部输出边界值。有没有哪位大佬能指点一下。

关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
DDPG多目标优化，求助！

为什么我用DDPG去做一个多目标优化，然后训练步数是3000步的时候critic是下降的，action的值也有变化，可是步数越大critic就上升了，然后action全部输出边界值。有没有哪位大佬能指点一下。
复制链接

扫一扫

dty2.0 CSDN认证博客专家 CSDN认证企业博客

码龄3年

1: 原创

186万+: 周排名

141万+: 总排名

122: 访问

: 等级

16: 积分

2: 粉丝

3: 获赞

1: 评论

0: 收藏

私信

关注

热门文章

DDPG多目标优化，求助！ 122

最新评论

DDPG多目标优化，求助！
悲伤のlamda: 你的做法是怎么样子的
DDPG多目标优化，求助！
CSDN-Ada助手: 恭喜您开始博客创作！DDPG多目标优化是一个复杂而有挑战性的话题，希望您能够在这篇博客中分享您的研究和经验。建议您在下一步的创作中，可以深入探讨DDPG多目标优化的具体应用场景和实践经验，这样能够让读者更好地理解和应用这一技术。加油！期待您更多精彩的博客内容！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。