李宏毅深度强化学习
Loki97
这个作者很懒,什么都没留下…
展开
-
【李宏毅深度强化学习2018】P1 Policy Gradient(Review)
第一讲 Policy Gradient (Review)PPO是 Policy Gradient 的变形,下面先复习 Policy Gradient。视频地址:https://www.bilibili.com/video/av24724071课件地址:http://speech.ee.ntu.edu.t...原创 2018-10-20 16:27:41 · 9637 阅读 · 4 评论 -
【李宏毅深度强化学习2018】P2 Proximal Policy Optimization (PPO)
第二讲 Proximal Policy Optimization(PPO)视频地址:https://www.bilibili.com/video/av24724071课件地址:http://speech.ee.ntu.edu.tw/~tlkagk/courses_MLDS18.html第一讲整理:【李宏毅深度强化学习2018】P1 ...原创 2018-10-21 16:03:16 · 6429 阅读 · 1 评论 -
【李宏毅深度强化学习2018】P3 Q-learning(Basic Idea)
第三讲 Q-learning(Basic Idea)视频地址:https://www.bilibili.com/video/av24724071?t=1121&p=3PPT地址:http://speech.ee.ntu.edu.tw/~tlkagk/courses/MLDS_2018/Lecture/QLearning%...原创 2018-11-15 22:57:33 · 3347 阅读 · 2 评论