百度飞桨强化学习7日打卡营学习心得
百度飞桨在国产开源深度学习框架领域堪称翘楚,尤其是开源了许多训练好的模型,比如CV中的VideoTag(https://github.com/PaddlePaddle/models/tree/develop/PaddleCV/video/application/video_tag) 和NLP里的ERNIE, 堪称业界良心。
最近学习了飞桨团队提供的免费强化学习7日打卡营,介绍了强化学习的入门知识,上手练习了五个项目,提供免费GPU算力,强烈推荐。
简单的入门知识介绍
Sarsa
Q-Learning
DQN
Policy Gradient
DDPG
练习项目介绍
共五个项目,最后一个大作业为使用DDPG解决四轴飞行器悬浮任务,需要调参,可以免费使用GPU, 推荐练习
环境依赖为
paddlepaddle1.6.3
parl1.3.1
gym
项目使用的RL环境是Baidu开源的PARL库
https://github.com/PaddlePaddle/PARL
示例代码已由官方开源
https://github.com/PaddlePaddle/PARL/tree/develop/examples/tutorials