记录一下,我从百度飞桨深度学习学院 《强化学习7日打卡营-世界冠军带你从零实践》,了解到的东西吧。。。
这不是按键精灵,靠颜色判断来打怪
这不是游戏辅助,用内存读写来刷图
而是真正的让AI学会玩游戏。。。
这就叫做-强化学习
什么是强化学习
- 强化学习(英语:
Reinforcement learning
,简称RL
)是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。 - 核心思想:智能体
agent
在环境environment
中学习,根据环境的状态state
(或观测到的observation
),执行动作action
,并根据环境的反馈reward
(奖励)来指导更好的动作。
课程中用到的是如下利器:
-
GYM
是强化学习中经典的环境库,用到里面的CliffWalkingWapper
和FrozenLake
环境,为了使得环境可视化更有趣一些,可以在PARL
代码库中的examples/tutorials/lesson1
中下载gridworld.py
使用。 -
PARL
开源库地址:https://github.com/PaddlePaddle/PARL
课程的内容如下:
链接在这里:https://aistudio.baidu.com/aistudio/education/group/info/1335
想学就自己去看吧。