actor-critic笔记

最新推荐文章于 2023-01-05 10:48:52 发布

dreamcube_block

最新推荐文章于 2023-01-05 10:48:52 发布

阅读量369

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dreamcubeblock/article/details/107381024

版权

actor-critic算法笔记

1.初始化actor网络和critic网络

2.根据当前state，通过动作估计网络得到最好的action，通过当前state和选择执行的action得到执行后的s'和reward（reward是负数，最大为0，就是惩罚，如果要做距离拟合的话可以将相差的距离置负当作reward）

（这里还有一步哦，要把action和得到的s'也带进critic网络得到一个Q‘值

我们最终要让reward学习到0（理想状态）

3.通过action和state输入critic网络得到Q值

4.用q值去更新actor网络的参数（目的是让Q值越来越高）

5用∑(R+γV(S′)−V(S,w))2求loss来更新（V(S')是之后state和action带入得到的，V(S,w)是当前state和action得到的，R是惩罚）critic网络的参数。

重复以上动作

dreamcube_block

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
actor-critic笔记

actor-critic算法笔记1.初始化actor网络和critic网络2.根据当前state，通过动作估计网络得到最好的action，通过当前state和选择执行的action得到执行后的s'和reward（reward是负数，最大为0，就是惩罚，如果要做距离拟合的话可以将相差的距离置负当作reward）（这里还有一步哦，要把action和得到的s'也带进critic网络得到一个Q‘值我们最终要让reward学习到0（理想状态）3.通过action和state输入critic网络得到
复制链接

扫一扫

dreamcube_block CSDN认证博客专家 CSDN认证企业博客

码龄5年

3: 原创

135万+: 周排名

59万+: 总排名

2万+: 访问

: 等级

66: 积分

2: 粉丝

3: 获赞

4: 评论

9: 收藏

私信

关注

热门文章

最新评论

PCL处理obj三维模型转换pcd点云的具体方法
sun_hui_Coder: 你好，能分享一下shapenetcorev2数据集嘛，官网不让下了
PCL处理obj三维模型转换pcd点云的具体方法
AI Bro: 牛蛙牛蛙，以后跟着大佬学习
PCL处理obj三维模型转换pcd点云的具体方法
dreamcube_block: 这个我不太懂，三维模型转换我其实是小白，单纯做cv需要用到数据集才去学的
PCL处理obj三维模型转换pcd点云的具体方法
忍性%: 请问一下可以将stl文件转成可以用itk进行配准的点云类型吗？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。