强化学习
强化学习入门教程,gym等环境的安装和配置,剖析经典AlphaZero算法,基础的强化学习算法,多智能体强化学习,Rllib的使用等等。
Quelquefois
RL小白
展开
-
理解几个和马尔科夫有关的概念
理解几个与马尔科夫相关的概念 文章目录理解几个与马尔科夫相关的概念马儿科夫过程学生问题MDP vs MRP 马儿科夫过程 定义:在一个时序过程中,如果 t+1t+1t+1时刻的状态仅取决于 ttt 时刻的状态 StS_tSt 而与 ttt之前的任何状态都无关时,则认为 ttt 时刻的状态 StS_tSt 具有马尔科夫性(Markov property)。 extend: 若过程中的每一个状态都...原创 2020-04-22 20:50:56 · 393 阅读 · 0 评论 -
深度强化学习入坑指南 Updating
正式入坑了,深度强化学习,Deep Reinforcement Learning 愿景是实现通用人工智能 在校期间断断续续学习过一些深度学习相关的内容,强化学习相对来说薄弱一些,不管是理论还是实践,未来一年要恶补了。 任务一 通读ICML DRL最新的论文,对该领域发展有个大概印象 掐指一算,19年还剩下6个月,至少得每周一篇了,第一遍给自己的目标是了解为主,如果有兴趣或者用到了再做深入阅读...原创 2019-06-25 15:07:35 · 713 阅读 · 0 评论