DeepChem教程27: 使用强化学习来玩Pong

lishaoan77

已于 2023-02-28 14:42:47 修改

阅读量798

点赞数

文章标签：深度学习 tensorflow pytorch 神经网络

于 2021-03-04 20:13:14 首次发布

本教程我们展示一下用强化学习来训练agent玩Pong。这个任务并不与化学直接相关，但是视频游戏可以展示强化学习技术。

安装

你应该用pip install 'gym[atari]'安装gym。（我们需要修饰器因为我们将使用atari游戏）。

In [ ]:

!curl -Lo conda_installer.py https://raw.githubusercontent.com/deepchem/deepchem/master/scripts/colab_install.py

import conda_installer

conda_installer.install()

!/root/miniconda/bin/conda info -e

In [ ]:

!pip install --pre deepchem

import deepchem

deepchem.__version__

In [ ]:

!pip install 'gym[atari]'

强化学习

强化学习调用agent与环境交互。这种情况下，环境是视频游戏，agent是玩家。通过不断试错，agent学习到了执行一些任务（赢得游戏）的策略。随着游戏的进行，它接收环境反馈的rewards，告诉它做得好坏。这种情况下，如果得分了就是接收了正的reward，如果另一个玩家得分了它就得了负的reward。