本人为国科大研一新生,所在组为国内语音强组。出于个人原因去了组内的大数据方向,后来又因为组内项目的安排被调去搞强化学习,目前组内只有我一个人面向RL领域,方向为强化学习与智能博弈。
本科阶段起各种项目和竞赛都是一个人走过来的,深感单打独斗的不易,特此记录一下自己的RL学习路线,供后来有需要的小伙伴参考。
一、在线资料
在线课程的话不用看太多,选一个看。
论文阅读方法:https://zhuanlan.zhihu.com/p/280750898
OpenAI Spinning Up:https://spinningup.openai.com/en/latest
强化学习交流Github:https://github.com/NeuronDance/DeepRL
机器学习交流Github:https://github.com/OUCMachineLearning/OUCML
David Silver 2015课程(中文字幕):https://www.bilibili.com/video/av45357759?from=search&seid=7037144790835305588
PPT:https://www.davidsilver.uk/teaching/
代码:https://github.com/qqiang00/reinforce/tree/master/reinforce/codes_for_book
UC Berkeley 2018课程(英文字幕):https://www.bilibili.com/video/BV1zt41127yx?from=search&seid=10719668478737526862
UCL 汪军教授《Multi-agent AI》课程:https://www.bilibili.com/video/BV1fz4y1S72S?p=1
《强化学习(第二版)》:https://rl.qiwihui.com/zh_CN/latest/chapter1/introduction.html
代码:https://github.com/AndyYue1893/reinforcement-learning-an-introduction
博弈论课程:https://www.bilibili.com/video/BV1zg4y1z77j?from=search&seid=7898903266300388141
二、书籍
列出个人看过并且觉得有一定作用的书籍。
《阿里云天池大赛赛题解析》(直接介绍了numpy/pandas/matplotlib/keras等库的基本用法,不会真有人一上来就会写代码吧,不会吧不会吧)
《强化学习:原理与Python实现》(介绍了RL的基本数学原理,附带gym环境下部分Atari游戏的Agent实现)
《Python深度学习:基于PyTorch》(实战水平检验)
《策略思维 商界、政界及日常生活中的策略竞争》(简要介绍了博弈论的思维和一些小例子)
《博弈论基础》 小绿本(只能看懂第一章,对不起/掩面5555)
三、公众号
这几个公众号的内容质量都不错,而且没有恰饭广告,十分推荐。
深度强化学习实验室
RLCN
机器之心
Datawhale
四、顶级会议
在,看看论文?现在开始要跑起来了,再不跑的话idea要被抢发了。
看论文个人觉得最好使的网站莫过于arxiv
NeurIPS
AAAI
ICLR
ICML
IJCAI
CoRL