Q-learning算法

最新推荐文章于 2023-08-04 00:56:28 发布

你会知道我是谁

最新推荐文章于 2023-08-04 00:56:28 发布

阅读量581

点赞数

分类专栏：强化学习文章标签：机器学习强化学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34619572/article/details/106181901

版权

强化学习专栏收录该内容

3 篇文章 1 订阅

订阅专栏

Q-learning:是一种无模型RL的形式，

缺点：

在估计动作价值的时候包含了“选取最大估计”的步骤，所以在学习的过程中可能会导致过估计，特别是DQN算法。如果这种过估计不均匀或者没有集中在想要了解的状态上，就会产生负面的影响。

你会知道我是谁

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Q-learning算法

缺点：在估计动作价值的时候包含了“选取最大估计”的步骤，所以在学习的过程中可能会导致过估计，特别是DQN算法。如果这种过估计不均匀或者没有集中在想要了解的状态上，就会产生负面的影响。...
复制链接

扫一扫

专栏目录

你会知道我是谁 CSDN认证博客专家 CSDN认证企业博客

码龄8年

23: 原创

54万+: 周排名

150万+: 总排名

6万+: 访问

: 等级

645: 积分

11: 粉丝

22: 获赞

11: 评论

143: 收藏

私信

关注

热门文章

分类专栏

软件使用 4篇
笔记 4篇
图像处理 1篇
EMBA
pytorch 1篇
深度学习 6篇
Tensorflow 4篇
Python 3篇
OpenCv 1篇
项目实战 2篇
强化学习 3篇
Ubuntu 2篇
OpenAI 1篇

最新评论

图像数据量计算
weixin_42274119: 多大的图像？1024*768？
dense层、激活函数、输出层设计
你会知道我是谁: 好久不用了，我也忘了，你百度下。我现在搞3d比较多了。。
dense层、激活函数、输出层设计
你会知道我是谁: 激活函数随便一本书都有，关于神经网络的就可以，不好意思好久没上了。
dense层、激活函数、输出层设计
kxwang: 请问激活函数截图来自那本书？谢谢
dense层、激活函数、输出层设计
Lethe2777: 我想问一下最后的layers.Dense(10)是什么意思呢，纯纯小白

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。