gym强化学习入门demo——随机选取动作其实有了这些动作和反馈值以后就可以用来训练DNN网络了...

最新推荐文章于 2024-03-29 19:55:12 发布

djph26741

最新推荐文章于 2024-03-29 19:55:12 发布

阅读量262

点赞数

文章标签：人工智能

原文链接：http://www.cnblogs.com/bonelee/p/9149608.html

版权

# -*- coding: utf-8 -*-
import gym
import time
env = gym.make('CartPole-v0')
observation = env.reset()
print(observation)

print("env actionspace：")
print(env.action_space)

print("env observationspace：")
print(env.observation_space)
print(env.observation_space.high)
print(env.observation_space.low)

count = 0
for t in range(100):
    #随机选择一个动作
    action = env.action_space.sample()
    #执行动作 获取环境反馈
    observation, reward, done, info = env.step(action)
    #如果玩死了就退出
    if done:
        break
    env.render()
    count+=1
    time.sleep(0.2)
print(count)

效果图：

转载于:https://www.cnblogs.com/bonelee/p/9149608.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

djph26741

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
gym强化学习入门demo——随机选取动作其实有了这些动作和反馈值以后就可以用来训练DNN网络了...

# -*- coding: utf-8 -*-import gymimport timeenv = gym.make('CartPole-v0')observation = env.reset()print(observation)print("env actionspace：")print(env.action_space)print(...
复制链接

扫一扫