上周有幸参加了百度举办的强化学习7日打卡营的课程,系统学习了强化学习基本概念和在百度Parl工具中实现强化学习的流程。下面讲一下我的一些心得体会。
1. 在上这门课之前,我有系统的看过deepmind的David Silver的强化学习视频课程,以及李宏毅老师的强化学习的视频。对于强化学习的基础知识很熟悉,但是缺乏实操经验。而这次百度举办的课程,恰恰很重视代码实践。我原来有很多混淆和不清楚的概念,在实际看代码之后都有了更清晰的体会,感觉非常有帮助。
2. 反过来讲,如果一位同学对强化学习感兴趣,但是从来没有听过David silver或者其他的基础入门课程,甚至还缺乏深度学习的相关知识的话,我不建议直接用百度的这门课入手,会比较难以理解。百度这门课更加适合已经理解理论之后,想要动手操作的同学们。
3. 还有个很大的遗憾是,这门课的时间太短了,只有几天时间,最新的一些方法还没有讲到。如果能够将A3C,甚至介绍一下alphaGO的实现,我都觉得会使得这门课更加的有深度有内涵。所以我个人是强烈希望有第二期的,把最新的方法也介绍和实现一下。