![](https://img-blog.csdnimg.cn/20210612141103369.jpeg?x-oss-process=image/resize,m_fixed,h_224,w_224)
机器学习
文章平均质量分 93
小黑小暑
o0o_-_
这个作者很懒,什么都没留下…
展开
-
【强化学习/gym】(二)一些强化学习的框架或代码
说在前面基础框架:torch(th)和tensorflow(tf)说明:博主对本文所涉及的框架以及代码都进行了一定的尝试或者接触,但是并不是所有都在自定义环境中运行过。Keras(tf)keras rlKeras文档中有四篇关于强化学习的例子,涉及的算法是Actor Critic、DDPG、DQN、PPO这几个例子代码都比较简洁,并且有清晰明了的说明,便于学习。TensorFlow(tf)ACtensorflow的官方教程中也有一个强化学习的例子,它是用Jupyter Not原创 2021-07-25 23:55:08 · 1798 阅读 · 0 评论 -
【强化学习/tf/gym】(一)创建自定义gym环境
文章目录说在前面目标准备工作开始gym envaction spaceobservation spacereset说在前面环境:Windows10python版本:3.6gym版本:0.18.3目标本文将使用gym自定义一个简单的环境。如下所示:其中蓝色小球为其它球,紫色小球为agent/玩家控制的球。蓝色小球只会往一个方向移动,紫色小球可以往任意方向移动。所有球移动到边界外后都会从另一边进入。球的移动速度受球本身大小影响,球越大,移动越慢。所有球之间都可以相互吞噬,但只能原创 2021-06-26 16:49:36 · 13905 阅读 · 18 评论 -
【强化学习/OpenAI】强化学习中的关键概念
文章目录说在前面开始强化学习能做什么关键概念和术语states and observationsaction spacespoliciesdeterministic policiesstochastic policiestrajectoriesdifferent formulations of returnthe RL optimization problemvalue functions说在前面原文地址:OpenAI其它:本文为翻译开始欢迎来到我们的强化学习介绍,这篇文章会涉及以下知识翻译 2021-06-13 21:35:34 · 1146 阅读 · 0 评论 -
【强化学习/gym】初步认识以及一些测试
说在前面测试环境:google colab(墙,python3.7)其它:目前关于gym的文章已经挺多了,这里仅记录一些自己的理解以及测试用例文档原文初步理解关于强化学习的概念不再赘述。gym定义了一套接口,用于描述强化学习中的环境(env)这一概念,同时在其官方库中,包含了一些已实现的环境。该库侧重于环境,而非算法。该库既收录或实现了许多环境,并且在其规则下,也可以快速的构建环境。However, RL research is also slowed dow原创 2021-06-12 14:08:42 · 2586 阅读 · 1 评论