课程简介
笔者最近在刷强化学习相关的基础课程,一番调研之后选定UCL和UCB的两门公开课,刚好代表目前RL领域最火的两个流派。关于两个流派的对比讨论,详见知乎 请问DeepMind和OpenAI身后的两大RL流派有什么具体的区别?
简单介绍一下两个课程:
- UCL Course on RL
- DeepMind当家人David Silver从头讲到尾,深入浅出,清晰明了。
- 可能是因为是在UCL开课的原因,讲的非常细致仔细,一点一点拆开来讲,有视频有讲义,质量都很高,对新手是相当友好了。
- 课程思路是RL-intro那本书的思路,value-based为主,policy gradient做了一节课的简要介绍,最后延伸的是DQN, MCTS相关方法,和Silver的研究思路一致。
- 15年的课程了,虽然基础概念不变,但缺少对新方法的介绍。Standford开的课程