深度强化学习
文章平均质量分 88
无所知
Old student
展开
-
深度强化学习cs294 Lecture1: Introduction and Course Overview
cs294 Lecture1: Introduction and Course Overview强化学习介绍为什么现在学习深度强化学习序列决策需要解决的其他问题reward从哪里来其他类型的监督学习我们如何建立智能系统第一次看到了该做hw1,然后被吓退。而今卷土重来,一定好好上完23333强化学习介绍当我们要建立一个智能系统的时候需要考虑什么?比如在一艘远洋巨轮上,我们有很好的航行系统和算法...原创 2018-11-21 23:24:23 · 445 阅读 · 0 评论 -
深度强化学习cs294 Lecture2: Supervised Learning of behaviors
cs294 Lecture2: Supervised Learning of behaviorsDefinition of sequential decision problemsTerminology & notationImitation learning: supervised learning for decision makingCase studies of recent wo...原创 2018-11-22 21:31:27 · 416 阅读 · 0 评论 -
深度强化学习cs294 HW1: Imitation Learning
终于把第一次作业完成了,不过实现效果貌似很差,调不好了就这样吧。Section 1第一部分先装环境。没啥好说的。我用的anaconda直接pip install 对应的作业1文件夹里的requirement.txt。其中MuJoCo需要激活个key,可以去官网使用学生邮箱申请一个免费的,时间为一年。这次要用的6个环境如下,盗图一张:Section2进入正题。这次的作业是完成模仿学习。在...原创 2018-11-25 19:54:43 · 2195 阅读 · 0 评论 -
深度强化学习cs294 Lecture3&Lecture4: Introduction to Reinforcement Learning
深度强化学习cs294 Lecture3&Lecture4: Introduction toReinforcement Learning1. Definition of a Markov decision process2. Definition of reinforcement learning problem3. Anatomy of a RL algorithm4. Brief ov...原创 2018-11-23 15:58:28 · 380 阅读 · 0 评论 -
深度强化学习cs294 Lecture5: Policy Gradients Introduction
深度强化学习cs294 Lecture5: Policy Gradients Introduction1. The policy gradient algorithm2. What does the policy gradient do?3. Basic variance reduction: causality4. Basic variance reduction: baseline5. Off...原创 2018-11-27 20:36:38 · 739 阅读 · 0 评论 -
深度强化学习cs294 Lecture6: Actor-Critic Algorithms
深度强化学习cs294 Lecture6: Actor-Critic Algorithms1. Improving the policy gradient with a critic2. The policy evaluation problem3. Discount factors4. The actor-critic algorithmState-dependent baselines复习一...原创 2018-11-28 16:11:24 · 1318 阅读 · 0 评论 -
深度强化学习cs294 Lecture7: Value Function Methods
深度强化学习cs294 Lecture7: Value Function MethodsValue-based MethodsQ-LearningValue Function Learning Theory回忆上节课所讲的内容,关于actor-critic算法的讲解。将policy gradient方法中目标函数梯度的计算进行一些替换,加入了bootstrapping减小方差,定义了无限步长形势...原创 2018-12-05 20:08:24 · 596 阅读 · 0 评论 -
深度强化学习cs294 Lecture8: Deep RL with Q-Function
深度强化学习cs294 Lecture8: Deep RL with Q-Function1. How we can make Q-learning work with deep networks2. A generalized view of Q-learning algorithms3. Tricks for improving Q-learning in practice4. Continu...原创 2018-12-06 14:50:42 · 452 阅读 · 0 评论