- 博客(1)
- 资源 (6)
- 收藏
- 关注
原创 强化学习基础四--Policy Gradient 理论推导
本文原文见我的知乎主页:https://www.zhihu.com/people/ikerpeng/ 参考:David Silver,Tutorial: Deep Reinforcement Learning,2016.Pieter Abbeel,Policy Optimization,2017.Hodo van Hasselt,Deep reinforcement Learni
2017-11-23 13:28:30 8276 3
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人