![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
强化学习
绿竹巷人
不想做算法工程师的算法工程师
展开
-
gym中toy text——Q-learning实现
描述使用Q-leaning算法实现gym中的toy texttoy text环境gym中的toy text环境包含很多中,这里介绍三种带渲染环境的FrozenLake-v0冬天来了。你和你的朋友在公园里玩飞盘的时候,你疯狂地把飞盘扔在了湖中央。水大部分是冻结的,但有几个洞的冰已经融化。如果你踏进其中一个洞,你就会掉进冰冷的水里。在这个时候,有一个国际飞盘短缺,所以你绝对有必要航行到湖的另一边并取回飞盘。然而,冰面很滑,所以你不能总是按照你想要的方向移动。表面用网格描述如下:S: 起始点,原创 2020-07-06 12:10:04 · 1059 阅读 · 0 评论 -
初识gym——why is gym?
whogym中的环境有几种,都可以在官网找到gym官网—环境Classic control and toy text(经典控制和玩具文本)Atari(Atari游戏)2D and 3D robots(2D和3D机器人)使用代码from gym import envsprint(envs.registry.all())输出会是一个字典,其中包含gym的全部环境开发RL算法时,请使用下面的写法,很简单import gymenv = gym.make('CartPole-v0')B原创 2020-07-01 10:32:23 · 453 阅读 · 0 评论 -
gym初级——初始gym环境(二)
描述接上一篇gym初级——初始gym环境(一)代码动作空间和状态空间的数据类型import gymenv = gym.make('CartPole-v0')print(env.action_space)print(env.observation_space)输出结果为Discrete(2)Box(4,)意思是动作空间中的动作是离散(Discrete)的2个动作,状态空间中的状态是4维的数组动作空间和状态空间的数据大小import gymenv = gym.make('Cart原创 2020-07-01 10:15:50 · 1334 阅读 · 0 评论 -
gym初级——初识gym环境(一)
描述从今天开始,有机会我会写一些有关强化学习的博客这一篇是关于gym环境的环境import gymenv = gym.make('CartPole-v0')env.reset()for _ in range(1000): env.render() env.step(env.action_space.sample()) # take a random actionenv.close()运行这段程序,是一个小车倒立摆的环境可以把CartPole-v0替换为其他环境,比如M原创 2020-06-30 23:11:21 · 2150 阅读 · 0 评论 -
Mac安装gym
描述mac系统下安装gym假设你的电脑已经安装了python环境、pip工具、Anaconda等常见必要的开发工具(为什么这么说,因为我的电脑已经有了很多配置,所以纯净的mac系统去安装gym我没试过)安装命令有两种安装方式,都可以。第一种:很直接使用这一种安装命令的话,你看不到源码,以后大部分代码就自己去开发吧pip install gym第二种:源码安装使用这种方式,能看到一些示例和源码,但是安装过程可能会出现问题官方的安装命令是这样的git clone https://gith原创 2020-06-30 21:46:41 · 2286 阅读 · 6 评论