DeepChem教程27: 使用强化学习来玩Pong

本教程我们展示一下用强化学习来训练agentPong。这个任务并不与化学直接相关,但是视频游戏可以展示强化学习技术。

安装

你应该用pip install 'gym[atari]'安装gym。(我们需要修饰器因为我们将使用atari游戏)。

In [ ]:

!curl -Lo conda_installer.py https://raw.githubusercontent.com/deepchem/deepchem/master/scripts/colab_install.py

import conda_installer

conda_installer.install()

!/root/miniconda/bin/conda info -e

In [ ]:

!pip install --pre deepchem

import deepchem

deepchem.__version__

In [ ]:

!pip install 'gym[atari]'

强化学习

强化学习调用agent与环境交互。这种情况下,环境是视频游戏,agent是玩家。通过不断试错,agent学习到了执行一些任务(赢得游戏)的策略。随着游戏的进行,它接收环境反馈的rewards,告诉它做得好坏。这种情况下,如果得分了就是接收了正的reward,如     果另一个玩家得分了它就得了负的reward

第一步是创建执行环境的任务。幸运的是,OpenAI Gym已经提供了Pong的实施&#

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值