[跟着汀学强化学习Day2] Gym初次入门

最新推荐文章于 2024-04-18 16:18:54 发布

Asaskaa要加油

最新推荐文章于 2024-04-18 16:18:54 发布

阅读量98

点赞数

文章标签： python 人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35605091/article/details/133954827

版权

1.创建CartPole-v0的环境

2.介绍环境的具体组成：每个环境都有observation space和action space

这个环境下的action space是二维，应该是{0,1}

action_space的类型是离散Discrete类型，范围是{0,1,...,n-1}长度为n的非负整数集合

observation_space是个Box类型，表示n维的盒子

3.对于Step的介绍

在每次执行完action以后，step函数会返回四个值，包括观测、奖励、完成、信息。

观测是执行完以后的环境状态

奖励是执行完以后智能体获得的奖励

完成是执行完以后当前instance/environment对象是否结束，这个是Boolen变量，如果为True表明当前回合episode或者tial结束，可以重置reset了

信息：大概用不着，是调试过程的诊断信息

4.Gym仿真的流程：每一个回合开始时，要重置环境reset（）函数，返回初始观测信息，然后根据done标志位的状态，决定是否进行下一回合

4.一些常用函数汇总

Asaskaa要加油

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
[跟着汀学强化学习Day2] Gym初次入门

完成是执行完以后当前instance/environment对象是否结束，这个是Boolen变量，如果为True表明当前回合episode或者tial结束，可以重置reset了。4.Gym仿真的流程：每一个回合开始时，要重置环境reset（）函数，返回初始观测信息，然后根据done标志位的状态，决定是否进行下一回合。action_space的类型是离散Discrete类型，范围是{0,1,...,n-1}长度为n的非负整数集合。这个环境下的action space是二维，应该是{0,1}
复制链接

扫一扫

Asaskaa要加油 CSDN认证博客专家 CSDN认证企业博客

码龄8年

3: 原创

191万+: 周排名

37万+: 总排名

350: 访问

: 等级

32: 积分

0: 粉丝

1: 获赞

4: 评论

0: 收藏

私信

关注

热门文章

最新评论

[跟着汀学强化学习Day2] Gym初次入门
CSDN-Ada助手: 非常棒的博客！很高兴看到你对强化学习的学习进展。你的标题和摘要很吸引人，让我对Gym初次入门产生了浓厚的兴趣。在这个主题上，我想分享一些与你的博文相关但没有在标题和摘要中出现过的扩展知识和技能。首先是关于Gym环境的选择，你可以尝试不同的环境来进行强化学习的实验，比如CartPole、MountainCar等。此外，你还可以了解一些更高级的概念，如价值函数、策略梯度等，它们在强化学习中扮演着重要的角色。希望我的建议对你有所帮助，并鼓励你继续创作更多关于强化学习的博客。谦虚地说，我相信你可以在这个领域取得更大的成就！加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
[跟着汀学强化学习Day3] Gym简单画图+自己环境搭建
CSDN-Ada助手: 恭喜你写了第三篇博客！看到你标题中提到了学习强化学习、Gym简单画图和自己环境搭建，我对你的学习进展感到非常兴奋。你的博客内容很实用，对于那些想要进一步了解强化学习的人来说肯定会非常有帮助。不过，我想在下一步的创作中，你可以考虑更多地分享一些你在学习过程中遇到的困难和解决方案。这样，读者们更能从你的经验中受益，并且可能会给你提供一些有价值的建议。同时，也希望你能更多地提及一些相关的学习资源，这样读者们可以进一步深入学习和探索。继续保持努力，期待你的下一篇博客！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
[跟着汀学强化学习Day1] Gym环境安装
Asaskaa要加油: 是你吗快乐的海盗
[跟着汀学强化学习Day1] Gym环境安装
CSDN-Ada助手: 非常恭喜你开始了博客创作之旅！标题中的“Gym环境安装”给人一种你正在积极探索学习强化学习的感觉，这是一个非常有趣且充满挑战的领域。希望你能在这一系列的博客中分享你的学习心得和经验。作为下一步的创作建议，我建议你可以继续深入探索Gym环境的安装，并在博客中详细介绍一下安装过程中遇到的挑战以及你的解决方案。这将帮助其他读者更好地理解和应用这一技术。同时，如果可能的话，你还可以提供一些实际示例，让读者更好地理解如何使用Gym环境进行强化学习的实践。期待你接下来更多精彩的博客文章！加油！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
[跟着汀学强化学习Day1] Gym环境安装
快乐的海盗呢: xx请学习

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。