论文推荐
“SFFAI105期来自清华大学的翁文涛推荐的文章主要关注于基础研究的强化学习领域,你可以认真阅读讲者推荐的论文,来与讲者及同行线上交流哦。”
关注文章公众号
回复"SFFAI105"获取本主题精选论文
领域经典
01
推荐理由:使用ODE方法研究强化学习收敛性的开创文章。是这一领域的必读文献。
02
推荐理由:该文章分析了带函数近似的TD学习的收敛性。其中的许多建模与证明思想对现在的强化学习理论产生了深远的影响。
03
推荐理由:该文章将控制论中的Lyapunov分析思想巧妙地引入到了强化学习的理论分析中,开启了一大片研究方向。
领域前沿
04
推荐理由:该文章全面的介绍了如何使用随机近似理论分析Q-学习,并提出了改进Q-学习均方误差的方法。
05
推荐理由:该文章介绍了如何从理论上精准地计算线性随机近似方法的均方误差。
06
推荐理由:该文章首次刻画了表格型双Q-学习在有限时间内均方误差的收敛速度。
会议内容
会议简介
强化学习近年来在控制、机器人、自动驾驶、