强化学习经典算法笔记(十六):Policy Gradient算法家族
在学习Soft Actor-Critic,SAC算法时,发现了一篇非常好的文章,比较全面地介绍了策略梯度算法家族。文章的作者是在OpenAI工作的Lilian Weng小姐姐,佩服至极!!
文章链接:
Policy Gradient Algorithms
为了系统地学习一下,我决定翻译一下,尽管已经有了中文版。
先占个坑。
在学习Soft Actor-Critic,SAC算法时,发现了一篇非常好的文章,比较全面地介绍了策略梯度算法家族。文章的作者是在OpenAI工作的Lilian Weng小姐姐,佩服至极!!
文章链接:
Policy Gradient Algorithms
为了系统地学习一下,我决定翻译一下,尽管已经有了中文版。
先占个坑。