强化学习实践
文章平均质量分 73
实践
笑傲江湖2023
这个作者很懒,什么都没留下…
展开
-
强化学习实践(三)基于gym搭建自己的环境(在gym0.26.2可运行)
自我搭建的环境可以视为一个类。主要包含:变量、函数。变量:必须含有动作和状态,如self.states 状态空间,self.actions 动作空间,self.t 状态转移,self.rewards 回报,self.terminate_states 终止状态等。函数包含:__init __seed,step,原创 2023-10-08 23:27:22 · 1977 阅读 · 3 评论 -
强化学习实践(一)Gym介绍
学了一段时间强化学习的理论,近期准备进行一些算法实践。应用算法的前提是要创建一个合适的仿真环境,目前Openai的) 是主流的强化学习实验环境库。Gym已经集成许多开发好的环境,让RL的研究者们可以直接上手使用,而不需要按照论文中的描述重建环境,当然也可以在Gym中构建自己需要的环境。 主要是经典强化学习文献中的控制理论问题,像平衡车的控制。注意,游戏环境需要单独安装下。基于Gym开发的机器人3D模拟环境,通过控制机器臂完成一些特定任务。原创 2023-10-04 22:38:32 · 440 阅读 · 0 评论 -
强化学习实践(二)Gym(安装、环境搭建、运行倒立摆(代码可运行))
1.2.3.4.原创 2023-10-04 22:42:23 · 1430 阅读 · 0 评论