- 博客(1)
- 资源 (6)
- 收藏
- 关注
原创 强化学习基础四--Policy Gradient 理论推导
本文原文见我的知乎主页:https://www.zhihu.com/people/ikerpeng/ 参考: David Silver,Tutorial: Deep Reinforcement Learning,2016. Pieter Abbeel,Policy Optimization,2017. Hodo van Hasselt,Deep reinforcement Learni
2017-11-23 13:28:30 8275 3
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人