李宏毅深度强化学习(国语)课程(2018)
文章平均质量分 72
Interesting AI
机器学习爱好者
展开
-
李宏毅深度强化学习(国语)课程(2018) 笔记(八)Imitation Learning
李宏毅深度强化学习(国语)课程(2018) 笔记(八)Imitation Learning原创 2022-07-06 10:14:31 · 241 阅读 · 0 评论 -
李宏毅深度强化学习(国语)课程(2018) 笔记(七)Sparce Reward
李宏毅深度强化学习(国语)课程(2018) 笔记(七)Sparce Reward原创 2022-07-05 10:51:10 · 183 阅读 · 0 评论 -
李宏毅深度强化学习(国语)课程(2018) 笔记(六)Actor-Critic
李宏毅深度强化学习(国语)课程(2018) 笔记(六)Actor-Critic原创 2022-07-03 11:25:19 · 289 阅读 · 0 评论 -
李宏毅深度强化学习(国语)课程(2018) 笔记(五)Q-learning (Continuous Action)
李宏毅深度强化学习(国语)课程(2018) 笔记(五)Q-learning (Continuous Action)原创 2022-07-02 09:49:23 · 228 阅读 · 0 评论 -
李宏毅深度强化学习(国语)课程(2018) 笔记(四)Q-learning (Advanced Tips)
李宏毅深度强化学习(国语)课程(2018) 笔记(四)Q-learning (Advanced Tips)原创 2022-06-30 11:19:21 · 267 阅读 · 0 评论 -
李宏毅深度强化学习(国语)课程(2018) 笔记(三)Q-learning (Basic Idea)
李宏毅深度强化学习(国语)课程(2018) 笔记(三)Q-learning (Basic Idea)原创 2022-06-28 12:21:38 · 287 阅读 · 0 评论 -
李宏毅深度强化学习(国语)课程(2018) 笔记(二)Proximal Policy Optimization(PPO)
李宏毅深度强化学习(国语)课程(2018) 笔记(二)Proximal Policy Optimization(PPO)原创 2022-06-27 20:48:21 · 578 阅读 · 0 评论 -
李宏毅深度强化学习(国语)课程(2018) 笔记(一)Policy Gradient (Review)
李宏毅深度强化学习(国语)课程(2018) 笔记原创 2022-06-26 23:21:48 · 832 阅读 · 0 评论