深度增强学习射击类游戏(vizdoom)

前端时间搞一个airsim的学习,通过ddqn的方式,然后这两天在尝试一些增强学习的训练;

Papers With Code上看到如下游戏

FPS Games | Papers With Code

GitHub - mwydmuch/ViZDoom: Doom-based AI Research Platform for Reinforcement Learning from Raw Visual Information.

然后在增强学习页面reinforcement-learning | Papers With Code看到项目 DLR-RM/stable-baselines3,

搭建环境如下:

首先要安装pytorch,1.8版本以上

然后安装stable-baselines3

pip install stable-baselines3

然后安装游戏

sudo apt install cmake libboost-all-dev libsdl2-dev libfreetype6-dev libgl1-mesa-dev libglu1-mesa-dev libpng-dev libjpeg-dev libbz2-dev libfluidsynth-dev libgme-dev libopenal-dev zlib1g-dev timidity tar nasm
pip install vizdoom

当然安装过程肯定有很多依赖,相关依赖可从上面链接中看到

然后开始训练

import gym
from vizdoom import gym_wrapper

from stable_baselines3 import PPO

# env = gym.make("CartPole-v1")
env = gym.make("VizdoomHealthGatheringSupreme-v0")

model = PPO("MultiInputPolicy", env, verbose=1)
model.learn(total_timesteps=10_000)

obs = env.reset()
for i in range(10000):
    action, _states = model.predict(obs, deterministic=True)
    obs, reward, done, info = env.step(action)
    env.render()
    if done:
      obs = env.reset()

env.close()

啊——,到现在位置,看起来没有语法错误,至于是否可以训练出预期结果,尚不可知(我在虚拟机里调试的)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值