用Caffe基于DQN玩Atari游戏

前言


2013年DeepMind 在NIPS上发表Playing Atari with Deep Reinforcement Learning 一文,提出了DQN(Deep Q Network)算法,实现端到端学习玩Atari游戏,即只有像素输入,看着屏幕玩游戏。Deep Mind就凭借这个应用以6亿美元被Google收购。由于DQN的开源,在github上涌现了大量各种版本的DQN程序。这里实现一种用Caffe实现的版本,详细描述一下环境配置和运行过程。

准备


  1. dqn-in-the-caffe
  2. Caffe
  3. ALE最新的是0.5.1版本,但是一直有问题,建议使用0.4.4版本,ALE安装教程和使用教程在安装包里面manual.pdf。

开始配置环境


ALE

安装SDL 按照manual.pdf
$PATH/ale_0.4.4/ale_0_4$ cp makefile.unix makefile
打开SDL
USE_SDL := 1
$PATH/ale_0.4.4/ale_0_4$ make

Caffe

make all
make test
make runtest
make distribute
caffe的环境配置这里不做介绍
protoc src/caffe/proto/caffe.proto –cpp_out=.
mkdir include/caffe/proto
mv src/caffe/proto/caffe.pb.h include/caffe/proto
PYTHONPATH=”/home/ajay/pylearn2:/home/ajay/pylearn2/pylearn2/scripts:/usr/local/caffe/python/caffe:$PYTHONPATH”
export PYTHONPATH

DQN

修改cmake配置
option(CPU_ONLY "Use CPU only for Caffe" OFF)
option(USE_CUDNN "Use cuDNN for Caffe" OFF)
option(USE_SDL "Use SDL for ALE" ON)
include_directories(your_path/caffe-dqn/include)
include_directories(/usr/local/cuda-7.0/include)
include_directories(your_path/ale_0.4.4/ale_0_4/src)
link_directories(your_path/caffe-dqn/build/lib)
link_directories(your_path/ale_0.4.4/ale_0_4)

mkdir build
cd build
cmake ..
make
如果成功会显示If everything works the last two lines will be
Linking CXX executable dqn
[100%] Built target dqn
接下来需要找一个游戏文件breakout.bin
将breakout.bin,dqn_solver.prototxt,dqn.prototxt放在build下
your_path/dqn-in-the-caffe-master/build$ ./dqn
如果用GPU就将其打开
option(CPU_ONLY “Use CPU only for Caffe” ON)
cmake ..
make
./dqn -gpu
训练好后测试
./dqn -evaluate -gui -repeat_games 100 -model snapshots/train_iter_2000000.caffemodel

运行结果


这里写图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值