强化学习找金币游戏Gym环境测试调试问题

最新推荐文章于 2023-10-31 17:27:57 发布

大浪淘沙啊

最新推荐文章于 2023-10-31 17:27:57 发布

阅读量1.4k

点赞数 5

文章标签：游戏 python 强化学习

本文链接：https://blog.csdn.net/qq_43513349/article/details/107226584

版权

本文介绍了如何在Gym环境中配置和调试强化学习中的找金币游戏。详细步骤包括将环境文件grid_mdp.py复制到指定目录，更新_init_.py文件以注册环境，并解决在测试过程中遇到的报错问题，如方法命名和Python版本不兼容等。

摘要由CSDN通过智能技术生成

强化学习找金币游戏Gym环境测试调试问题

下图为机器人在网格世界找金币的示意图。该网格世界一共有８个状态，其中状态６和状态8为死亡区域，状态７为金币区域。机器人的初始位置为网格世界中任意一个状态。机器人从初始状态出发寻找金币。机器人进行一次探索，进入死亡区域或找到金币，本次探测结束。
机器人找到金币的回报为１，进入死亡区域回报为－１，机器人在区域1－５之间转换时，回报为０。
目标是找到一个策略使得机器人不管处在什么状态（１－５）都能找到金币。
在这里插入图片描述
在《深入浅出强化学习：原理入门》一书中给出找金币游戏的Gym开发环境代码，grid_mdp.py文件中。如下：https://github.com/gxnk/reinforcement-learning-code

为自己强化学习代码在Gym中进行环境配置

第⼀步，将我们⾃⼰的环境⽂件（grid_mdp.py）拷⻉gym安装⽬录/gym/envs/classic_control⽂件夹中（拷⻉在此⽂件夹中是因为要使⽤rendering模块）。
第⼆步，打开该⽂件夹（第⼀步中的⽂件夹）下的_init_.py⽂件，在⽂件末尾加⼊语句：
from gym.envs.classic_control.grid_mdp import GridEnv
第三步，进⼊⽂件夹的gym安装⽬录/gym/gym/envs，打开该⽂件夹下的_init_.py⽂件，添加代码如下。第⼀个参数id就是你调⽤gym.make（‘id’）时的id，这个id可以随便选取，源代码取名GridWorld-v0。

register(
    id='GridWorld-v0',
    entry_point='gym.envs.classic_control:GridEnv',
    max_episode_steps=200

最低0.47元/天解锁文章

大浪淘沙啊

关注

5
点赞
踩
5

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫