强化学习应用——倒立摆

最新推荐文章于 2024-07-10 10:46:05 发布

ThreeS_tones

最新推荐文章于 2024-07-10 10:46:05 发布

阅读量392

点赞数 2

分类专栏： DRL 文章标签： pygame python 开发语言

本文链接：https://blog.csdn.net/ThreeS_tones/article/details/136447382

版权

DRL 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

本文介绍了如何在Python中通过pip安装gym和pygame库，然后构建一个Gym环境（如CartPole-v1），实现强化学习中的倒立摆模拟，并提供了可运行的代码示例。

摘要由CSDN通过智能技术生成

新建虚拟环境并安装：

pip install gym

pip install pygame

运行下列代码：

import gym
import time
# 生成环境
env = gym.make('CartPole-v1', render_mode='human') # human指在人类显示器或终端上渲染
# 环境初始化
state = env.reset()
# 循环交互
while True:
    # 渲染画面
    env.render()
    # 从动作空间随机获取一个动作
    action = env.action_space.sample()
    # agent与环境进行一步交互
    state, reward, done, truncated, info = env.step(action)
    print('动作 = {0}: 当前状态 = {1}, 奖励 = {2}, 结束标志 = {3}, 日志信息 = {4}'.format(action, state, reward, done,info))
    # 判断当前episode 是否完成
    if done:
        print('done')
        break
    time.sleep(0.1)
# 环境结束
env.close()

参考：

强化学习实践（二）Gym（安装、环境搭建、运行倒立摆（代码可运行））_gym库-CSDN博客