使用键盘玩gym的游戏

最新推荐文章于 2024-08-10 17:39:43 发布

疯狂的大山鸡

最新推荐文章于 2024-08-10 17:39:43 发布

阅读量2.1k

点赞数 1

分类专栏：深度学习

本文链接：https://blog.csdn.net/hlpower/article/details/104059895

版权

深度学习专栏收录该内容

19 篇文章 1 订阅

订阅专栏

使用键盘玩gym的游戏

背景
相关的库
代码

背景

在学习强化学习时候上手一般会是使用gym来入手，但其中的reward和action具体是如何的确不是很方便直接查看到，对于我们使用强化学习中，重新分配reward而言就造成了麻烦，因此最好的办法是使用键盘让我么你自己来玩玩游戏看看其中的reward是怎样的

代码

以打砖块为例子，action_space为4，也就是有4个按键

import gym
import keyboard
import numpy as np
import time

total_reward = 0
env = gym.make('Breakout-v0')
state = env.reset()

action = 0

def preprocess(img):
    img_temp = img.mean(axis = 2)
    x = -1
    y = -1
    if len(np.where((img_temp[100:189,8:152])!= 0)[0]) != 0:
        x = np.where((img_temp[100:189,8:152])!= 0)[0][0]
        y = np.where((img_temp[100:189,8:152])!= 0)[1][0]
    if len(np.where((img_temp[193:,8:152])!= 0)[0]) != 0:
        x = -2
        y = -2
    p = int(np.where(img_temp[191:193,8:152])[1].mean() - 7.5)
    #return img_temp
    return (x,y,p)

# 实际按键中只检测0，1，2，3 游戏中需要的按键
# 我添加了一个按键4，用于暂停
def abc(x):
    global action
    if x.event_type == "down" and x.name == '0':
        action = 0
    elif x.event_type == "down" and x.name == '1':
        action = 1
    elif x.event_type == "down" and x.name == '2':
        action = 2
    elif x.event_type == "down" and x.name == '3':
        action = 3
    elif x.event_type == "down" and (action == 4 or x.name == '4'):
        action = 4
    elif action != 4:
        action = 0

# 添加hook，以检测用户的按键
keyboard.hook(abc)
total_reward = 0
for j in range(1000):
    env.render()
    while action == 4:
        time.sleep(0.1)
    if action == 4:
        action = 0
    next_state,reward,done,_ = env.step(action)
    total_reward += reward
    (x2,y2,p2) = preprocess(next_state)
    print(action,total_reward,done,x2,y2,p2)
    time.sleep(0.1)
    if done:
        break
keyboard.wait()