强化学习《未完待续》

最新推荐文章于 2024-04-25 13:33:09 发布

chuanauc

最新推荐文章于 2024-04-25 13:33:09 发布

阅读量68

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41764621/article/details/114873426

版权

讲解Q-Learning和Sarsa 之间的区别： https://blog.csdn.net/u010223750/article/details/78955807

（这篇是上述连接的补充：https://blog.csdn.net/qq_39004117/article/details/81705845 还没看完，，，，，）

Q-learning算法则是一个off-policy的方法，其原始策略和值函数更新策略不一致，同样的也不需要进行采样一个轨迹进行策略更新。

和Sarsa算法不一样的是，Q-learning在更新值函数的时候使用的是贪心策略，而不是ϵ-greedy策略。

强化学习中on-policy 与off-policy有什么区别？https://www.zhihu.com/question/57159315

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
强化学习《未完待续》

讲解Q-Learning和Sarsa 之间的区别：https://blog.csdn.net/u010223750/article/details/78955807Q-learning算法则是一个off-policy的方法，其原始策略和值函数更新策略不一致，同样的也不需要进行采样一个轨迹进行策略更新。和Sarsa算法不一样的是，Q-learning在更新值函数的时候使用的是贪心策略，而不是ϵ-greedy策略。...
复制链接

扫一扫

chuanauc CSDN认证博客专家 CSDN认证企业博客

码龄7年

239: 原创

22万+: 周排名

2万+: 总排名

49万+: 访问

: 等级

3679: 积分

186: 粉丝

562: 获赞

99: 评论

1830: 收藏

私信

关注

热门文章

分类专栏

最新评论

Tensorboard的使用 ---- SummaryWriter类（pytorch版）
lizhe0413.: 这个报错咋整 Traceback (most recent call last): File "D:\py\pythonProject2\dataloader.py", line 16, in <module> writer.add_images("test_data",imgs,step,dataformats="NCHW") File "D:\Anaconda3\envs\d2l\lib\site-packages\torch\utils\tensorboard\writer.py", line 662, in add_images image(tag, img_tensor, dataformats=dataformats), global_step, walltime File "D:\Anaconda3\envs\d2l\lib\site-packages\torch\utils\tensorboard\summary.py", line 441, in image image = make_image(tensor, rescale=rescale) File "D:\Anaconda3\envs\d2l\lib\site-packages\torch\utils\tensorboard\summary.py", line 486, in make_image image = image.resize((scaled_width, scaled_height), Image.ANTIALIAS) AttributeError: module 'PIL.Image' has no attribute 'ANTIALIAS'
C++ 读写文件（整行读写&VSCodeC++环境配置）
qq_55227254: 朋友，我在vscode上运行c++代码想生成一个TXT文件，但是.cpp同级目录下没找到，而且用VS成功了。您知道是什么原因吗
安装 fcitx + 搜狗/谷歌输入法之后导致死机，重启后黑屏只有鼠标可以移动
dickredone: 帮大忙了
dgl 的cuda 版本环境配置(dgl cuda 版本库无法使用问题解决)
chuanauc: 我也是，只不过我不是Windows是Linux，感觉是conda提供的dgl包可能有哪里没配置对？
dgl 的cuda 版本环境配置(dgl cuda 版本库无法使用问题解决)
weixin_45361764: 我用conda install dglteam::dgl-cuda11.0命令无法安装，用whl安装的话import dgl和pip show dgl都报错，必须pip show dgl-cu110，不知道为什么

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。