开始前
继上次的《百度架构师手把手教深度学习》课程之后,百度又开设了《强化学习7日打卡营-世界冠军带你从零实践》,打卡营采用全程的直播+答疑+比赛的学习模式,7天时间里每日直播打卡学习、配合实战PK、全程社群答疑、百度飞桨认证结业证书等,让你的学习有见证有收获,求职有帮助!我果断找可爱的班班报名了。于是开始了我的“强化”之路!!!
附上课程链接地址:https://aistudio.baidu.com/aistudio/education/group/info/1335
进行中
通过第一课的学习,让我了解了强化学习是什么,对强化学习有了一个初印象。通过第二课的学习,了解了基于表格型方法求解RL,学会使用Srasa和Q-learning方法解决问题。通过第三课的学习,了解了基于神经网络方法求解RL,学会使用DQN方法求解问题,也深知调参这种东西是门神学。通过第四次课的学习,了解了基于策略梯度求解RL,学会使用PolicyGradient方法求解问题。通过第五课的学习,了解了连续动作空间上求解RL,学会使用DDPG方法解决问题。
- 课程大纲
- 课程安排
- 第一次课总结
- 第二次课总结
- 第三次课总结
- 第四次课总结
- 第五次课总结
结束时
最后感谢人美心善的科科老师以及可爱的班班,以及飞桨深度学习学院,感谢所有为《百度架构师手把手教深度学习》付出汗水的工作人员,没有你们,就没有这门课程,你们是重要的。还有要感谢与我一路同行学习本课程的同学们,没有你们,我可能就坚持不下来,你们也是重要的。最后的最后,强化学习的课程虽然结束了,但我的“强化”之路却刚刚开始,加油吧,少年!
链接
附上我AI Studio的作业链接:
- 第一次作业:leigangblog+1. 搭建环境,运行PARL+https://aistudio.baidu.com/aistudio/projectdetail/556842
- 第二次作业:leigangblog+2-1. 迷宫游戏Sarsa+https://aistudio.baidu.com/aistudio/projectdetail/565607
leigangblog+2-2. 迷宫游戏Q-learning+https://aistudio.baidu.com/aistudio/projectdetail/566688 - 第三次作业:leigangblog+3. DQN解决MountainCar+https://aistudio.baidu.com/aistudio/projectdetail/570791
- 第四次作业:leigangblog+4. PG解决Pong+https://aistudio.baidu.com/aistudio/projectdetail/578335
- 第五次作业:leigangblog+大作业:四轴飞行器悬浮+https://aistudio.baidu.com/aistudio/projectdetail/580404
附上B站的视频资料:
- 基于强化学习的迷宫游戏和悬崖问题:https://www.bilibili.com/video/BV14k4y1z78a
最后,欢迎各位同学点赞留言!!!