强化学习常见案例

吨吨不打野

已于 2022-04-26 20:42:43 修改

阅读量6.3k

点赞数 5

分类专栏：意外接触的一些知识 # 强化学习文章标签：强化学习

于 2021-01-28 16:58:34 首次发布

本文为博主原创文章，未经博主允许不得转载。

本文链接：https://blog.csdn.net/Castlehe/article/details/113347978

版权

意外接触的一些知识同时被 2 个专栏收录

50 篇文章

订阅专栏

8 篇文章

订阅专栏

本文汇总了多个强化学习的趣味示例和交互式体验，包括小红小蓝捉迷藏、红球绿球游戏、OpenAI的机器人跑步与赛艇游戏。此外，还介绍了GridWorld和Puckworld这两个可以在线操作的游戏环境，让学习者能够通过调整参数观察强化学习算法的效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

1. 有趣的强化学习视频
2.可以交互操作的游戏
- 2.1 GridWorld
- 2.2 Puck world

入门强化学习的时候，看到许多教程都给了很多强化学习的例子，有些是视频，有些是线上一些可以自己改参数看效果的游戏，这里做一个归类整理

1. 有趣的强化学习视频

1.1 小红小蓝捉迷藏

小红小蓝捉迷藏的链接: https://openai.com/blog/emergent-tool-use/
相应的视频应该是来自b站，（直接搜索emergent-tool-use 也会有很多类似的视频）【AI捉迷藏】初代天网？[中文字幕] Multi-Agent Hide and Seek

1.2 红球绿球

链接：https://github.com/PaddlePaddle/PARL/tree/develop/examples/MADDPG
在这里插入图片描述

1.3 OpenAI机器人跑步

http://blog.openai.com/openai-baselines-ppo
在这里插入图片描述

1.4 OpenAI赛艇游戏（CoastRunners）

faulty-reward-functions youtube视频源

bilibili视频源：https://www.bilibili.com/video/BV12t411M7ay?from=search&seid=14304792785749744782
文章来源：当AI开始“踢脏球”，你还敢信任强化学习吗？

2.可以交互操作的游戏

2.1 GridWorld

https://cs.stanford.edu/people/karpathy/reinforcejs/gridworld_dp.html
这个网站有GridWorld环境，类似下面

2.2 Puck world

https://cs.stanford.edu/people/karpathy/reinforcejs/gridworld_dp.html
有Puck world，类似下面

吨吨不打野

博客等级

码龄11年

人工智能领域新星创作者

博客专家认证

366
原创

1989
点赞

8609
收藏

1万+
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

最新评论

GitHub 2FA 双重身份验证(iPhone什么都不安装版~)
吨吨不打野: 密码app里存的那个扫码的密码和进备忘录里的那个txt里的码不一样，前者是二次身份验证用的码，后者是二次身份验证如果忘记了或者失败用的恢复码。 txt那个码如果丢了，出问题好像就是真的找不回来的那种
GitHub 2FA 双重身份验证(iPhone什么都不安装版~)
m0_61413426: 密码本身也是iCloud同步的，所以存进备忘录这步感觉是多余的吧。主要要丢一起丢，除非选择不同步密码。
C++——linux下使用gcc或者cmake进行c++程序开发
CSDN-Ada助手: 如何在 Linux 上配置和管理防火墙？
visual studio卡在正在下载/正在验证进度条（不进行安装）
吨吨不打野: 顶你上去，win10解决方案
visual studio卡在正在下载/正在验证进度条（不进行安装）
Hitachi_Marko: 如果问题是：“6dbc:0021][2025-05-07T10:35:56] WebClient failed in 'https://aka.ms/vs/17/release/installer' with '基础连接已经关闭: 未能为 SSL/TLS 安全通道建立信任关系。' - 'https://aka.ms/vs/17/release/installer'. [6dbc:0021][2025-05-07T10:35:56] Download failed using WebClient engine. System.Net.WebException: 基础连接已经关闭: 未能为 SSL/TLS 安全通道建立信任关系。 ---> System.Security.Authentication.AuthenticationException: 根据验证过程，远程证书无效。” 而直接访问https://aka.ms/vs/17/release/installer是可以下载到“vs_installer.opc”这个文件的话可以尝试：更新根证书打开 PowerShell，以管理员身份运行以下命令： certutil -generateSSTFromWU roots.sst Import-Certificate -FilePath .\roots.sst -CertStoreLocation Cert:\LocalMachine\Root （适用于 Windows 10 和更新版本）

大家在看

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

吨吨不打野 解决了问题，觉得还行就给点

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。