强化学习
RL
AI_Younger_Man
这个作者很懒,什么都没留下…
展开
-
深度强化学习8:Imitation Learning
【李宏毅深度强化学习笔记】8、Imitation Learning ...原创 2020-08-14 11:12:55 · 210 阅读 · 0 评论 -
深度强化学习5:Q-learning用于连续动作 (NAF算法)
【李宏毅深度强化学习笔记】5、Q-learning用于连续动作 (NAF算法) ...原创 2020-08-14 10:31:03 · 713 阅读 · 0 评论 -
深度强化学习3:Q-learning(Basic Idea)
【李宏毅深度强化学习笔记】3、Q-learning(Basic Idea) ...原创 2020-08-13 17:32:59 · 336 阅读 · 0 评论 -
深度强化学习1:策略梯度方法(Policy Gradient)
【李宏毅深度强化学习笔记】1、策略梯度方法(Policy Gradient) ...原创 2020-08-13 16:10:29 · 1409 阅读 · 0 评论 -
深度强化学习2:Proximal Policy Optimization算法(PPO)
【李宏毅深度强化学习笔记】2、Proximal Policy Optimization算法(PPO) ...原创 2020-08-13 16:09:29 · 1140 阅读 · 0 评论 -
强化学习(一)
深度强化学习浅析2015年2月的时候,google在nature上发了一篇用reinforcement learning 的方法来玩akari的小游戏,然后痛鞭人类2016的春天,又有大家都耳熟能详的alpha go,也是可以痛鞭人类David Silver 说 AI 就是 Reinforcement Learning加Deep LearningDeep Reinforcement Learning : AI = RL + DL原文阅读强化学习的应用场景在Reinforcement Learning里面转载 2020-06-23 11:39:15 · 503 阅读 · 0 评论