李宏毅机器学习课程-概述增强式学习ActorCritic0214
于 2022-02-14 21:03:51 首次发布
该博客介绍了李宏毅教授的2021春季机器学习课程,专注于增强式学习的Actor-Critic方法。内容包括Critic的详细解释,Critic的训练方式——MC(蒙特卡洛)与TD(时空差分)方法的对比,以及如何将Critic应用到训练过程中。
摘要由CSDN通过智能技术生成