从Q-learning到PPO大全 深度强化学习总结和理解
强化学习总结和理解,都是自己最近学习的总结 ,如果有不对的地方还请指出这一周一直在学强化学习,总结了常见经典算法,强化学习的资源很少,2015年alphago的成功才火起来。不知道未来会不会继续有突破,学完感觉比深度学习难了很多,资源也非常少,对数学要求极高,还需要提高数学和实践能力,以下为自己看了几十遍算法总结的心得。强化学习分为在线学习和离线学习Off-policy:q-learning...
原创
2019-02-28 11:38:32 ·
4655 阅读 ·
2 评论