强化学习(二)-Actor-Critic
什么是 Actor-Critic (强化学习) - 知乎 https://zhuanlan.zhihu.com/p/25831658强化学习中的一种结合体 Actor Critic (演员评判家), 它合并了以值为基础 (比如 Q learning) 和 以动作概率为基础 (比如 Policy Gradients) 两类强化学习算法。Actor 的前生是 Policy Gradients ,...
原创
2019-01-09 22:24:43 ·
601 阅读 ·
0 评论