强化学习方法汇总

最新推荐文章于 2024-05-29 14:23:25 发布

AI_Rancho

最新推荐文章于 2024-05-29 14:23:25 发布

阅读量491

点赞数

分类专栏：强化学习文章标签：强化学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/AI_future/article/details/107561568

版权

强化学习专栏收录该内容

7 篇文章 0 订阅

订阅专栏

model-free RL（依靠真实世界的反馈）：
1.Q learning
2.Sarsa
3.Policy Gradients

model-based RL（可以在想象中模拟）：
1.Q learning
2.Sarsa
3.Policy Gradients

policy-based RL(基于概率)：不一定选择最高概率
1.Policy Gradients

value-based RL：一定选择最大价值，连续的动作无法用基于价值
1.Q learning
2.Sarsa

actor-critic：两种方法结合，基于概率做出动作，critic对做出的动作给出它的价值

Monte-Carlo update（回合更新）：游戏结束后再更新
1.基础版Policy Gradients
2.Monte-Carlo learning

Temporal-Difference update（单步更新）：游戏中边玩边更新
1.Q learning
2.Sarsa
3.升级版Policy Gradients

On-Policy（在线学习）：自己边玩边学
1…Sarsa
2.Sarsa（λ）

Off-Policy（离线学习）：可以看别人玩而学习
1.Q learning
2.Deep Q Network

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
强化学习方法汇总

model-free RL（依靠真实世界的反馈）：1.Q learning2.Sarsa3.Policy Gradientsmodel-based RL（可以在想象中模拟）：1.Q learning2.Sarsa3.Policy Gradientspolicy-based RL(基于概率)：不一定选择最高概率1.Policy Gradientsvalue-based RL：一定选择最大价值，连续的动作无法用基于价值1.Q learning2.Sarsaactor-critic：两种
复制链接

扫一扫

专栏目录

AI_Rancho CSDN认证博客专家 CSDN认证企业博客

码龄7年

49: 原创

5万+: 周排名

8万+: 总排名

18万+: 访问

: 等级

2106: 积分

61: 粉丝

121: 获赞

37: 评论

426: 收藏

私信

关注

热门文章

分类专栏

创新中心 1篇
人机安全 5篇
机械臂 7篇
ROS 7篇
机器学习 24篇
UR3 1篇
CNN 1篇
python 11篇
意图理解 3篇
强化学习 7篇
统计学习 2篇
matlab 20篇
TensorFlow 2篇
SNN论文阅读 2篇
多感觉融合 2篇
脉冲神经网络 1篇
论文菜鸟 1篇
深度学习 2篇
算法 1篇
音频处理 3篇

最新评论

ubuntu22.04 手动分区说明
AI_Rancho: 设置完后选择install目录为你的efi区
ubuntu22.04 手动分区说明
J0138: 我也是这样的问题，该怎么解决呢
moveit自定义避障算法
Jay_Lebron: 看你的帖子，也没说为什么要og::后面还是RRTConnect而不是MyRRTConnect啊？
ubuntu22.04 手动分区说明
ifeng07: go back to the menu and correct this problem the partition table format in use on your disks normally requires you to create a separate partition for boot loader code. this partition should de marked for use as a "reserved bios boot area" and should de at least 1 mb in size. note that this is not same as a partition mounted in /boot. if you do not go back to the partitioning menu and correct,boot loader installation may fail later,although it may still be possible to install the loader to a partition.
ubuntu22.04 手动分区说明
ifeng07: 为啥我的还提示需要一个boot保留分区

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。