![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
深度强化学习
守望者白狼
深度强化学习、深度学习、自然语言处理 https://github.com/wolf-bailang
展开
-
24. 2020年秋季UC Berkeley CS285《深度强化学习》第6课:Actor-Critic算法_2/5【中英字幕
24. 2020年秋季UC Berkeley CS285《深度强化学习》第6课:Actor-Critic算法 https://www.bilibili.com/video/BV1E5411N7rD谢尔盖·莱文(Sergey Levine)加州大学伯克利分校电气工程和计算机科学系助理教授。专注于控制和机器学习之间的交集,目的是开发可使机器具有自主掌握执行复杂任务技能的算法和技术。尤其对如...翻译 2021-02-26 22:47:31 · 115 阅读 · 0 评论 -
23. 2020年秋季UC Berkeley CS285《深度强化学习》第6课:Actor-Critic算法_1/5【中英字幕】
23. 2020年秋季UC Berkeley CS285《深度强化学习》第6课:Actor-Critic算法 https://www.bilibili.com/video/BV1jV411q7c8谢尔盖·莱文(Sergey Levine)加州大学伯克利分校电气工程和计算机科学系助理教授。专注于控制和机器学习之间的交集,目的是开发可使机器具有自主掌握执行复杂任务技能的算法和技术。尤其对如...翻译 2021-02-24 22:42:43 · 122 阅读 · 0 评论 -
22. 2020年秋季UC Berkeley CS285《深度强化学习》第5课:策略梯度_6/6【中英字幕】
22. 2020年秋季UC Berkeley CS285《深度强化学习》第5课:策略梯度 https://www.bilibili.com/video/BV11y4y1E7NLhttps://youtu.be/PEzuojy8lVo谢尔盖·莱文(Sergey Levine)加州大学伯克利分校电气工程和计算机科学系助理教授。专注于控制和机器学习之间的交集,目的是开发可使机器具有自主掌握...翻译 2021-02-24 22:40:08 · 87 阅读 · 0 评论 -
21. 2020年秋季UC Berkeley CS285《深度强化学习》第5课:策略梯度_5/6【中英字幕】
21. 2020年秋季UC Berkeley CS285《深度强化学习》第5课:策略梯度 https://www.bilibili.com/video/BV1dy4y1E7GE谢尔盖·莱文(Sergey Levine)加州大学伯克利分校电气工程和计算机科学系助理教授。专注于控制和机器学习之间的交集,目的是开发可使机器具有自主掌握执行复杂任务技能的算法和技术。尤其对如何将学习用于掌握复杂...翻译 2021-02-23 12:18:07 · 61 阅读 · 0 评论 -
【paper解读】FCM:具体化 (Embodied)、自监督的小样本表示学习
原创 张军斌 AI约读社 今天收录于话题#强化学习 1 #自监督学习 8导读:大多数用于对象检测和识别的人工神经网络都是在fully supervised的条件下进行训练的。这不仅非常耗资源,因为它需要大量带标记的数据,而且与人类的学习方式也大不相同。这篇文章的作者首先让agent通过self-supervised exploration在模拟世界中学习。然后让agent通过与世界互动学习到的representations,在这个过程中引入一种称为快速概念映射 (Fast Concept Map原创 2021-02-22 09:19:54 · 376 阅读 · 0 评论 -
20. 2020年秋季UC Berkeley CS285《深度强化学习》第5课:策略梯度_4/6【中英字幕】
20. 2020年秋季UC Berkeley CS285《深度强化学习》第5课:策略梯度 https://www.bilibili.com/video/BV1Bh411r7xZ谢尔盖·莱文(Sergey Levine)加州大学伯克利分校电气工程和计算机科学系助理教授。专注于控制和机器学习之间的交集,目的是开发可使机器具有自主掌握执行复杂任务技能的算法和技术。尤其对如何将学习用于掌握复杂...翻译 2021-02-17 21:14:35 · 76 阅读 · 0 评论 -
19. 2020年秋季UC Berkeley CS285《深度强化学习》第5课:策略梯度_3/6【中英字幕】
19. 2020年秋季UC Berkeley CS285《深度强化学习》第5课:策略梯度 谢尔盖·莱文(Sergey Levine)加州大学伯克利分校电气工程和计算机科学系助理教授。专注于控制和机器学习之间的交集,目的是开发可使机器具有自主掌握执行复杂任务技能的算法和技术。尤其对如何将学习用于掌握复杂的行为技能感兴趣,以便赋予机器更大的自主权和智慧。http://rail.eecs.b...翻译 2021-02-13 16:01:23 · 69 阅读 · 0 评论 -
18. 2020年秋季UC Berkeley CS285《深度强化学习》第5课:策略梯度_2/6【中英字幕】
18. 2020年秋季UC Berkeley CS285《深度强化学习》第5课:策略梯度 谢尔盖·莱文(Sergey Levine)加州大学伯克利分校电气工程和计算机科学系助理教授。专注于控制和机器学习之间的交集,目的是开发可使机器具有自主掌握执行复杂任务技能的算法和技术。尤其对如何将学习用于掌握复杂的行为技能感兴趣,以便赋予机器更大的自主权和智慧。http://rail.eecs.b...翻译 2021-02-11 14:14:49 · 80 阅读 · 0 评论 -
17. 2020年秋季UC Berkeley CS285《深度强化学习》第5课:策略梯度_1/6【中英字幕】
17. 2020年秋季UC Berkeley CS285《深度强化学习》第5课:策略梯度 谢尔盖·莱文(Sergey Levine)加州大学伯克利分校电气工程和计算机科学系助理教授。专注于控制和机器学习之间的交集,目的是开发可使机器具有自主掌握执行复杂任务技能的算法和技术。尤其对如何将学习用于掌握复杂的行为技能感兴趣,以便赋予机器更大的自主权和智慧。http://rail.eecs.b...翻译 2021-01-27 11:59:56 · 95 阅读 · 0 评论 -
16. 2020年秋季UC Berkeley CS285《深度强化学习》第4课:强化学习导论_6/6【中英字幕】
16. 2020年秋季UC Berkeley CS285《深度强化学习》第4课:强化学习导论 https://www.bilibili.com/video/BV1SK4y1j7eL谢尔盖·莱文(Sergey Levine)加州大学伯克利分校电气工程和计算机科学系助理教授。专注于控制和机器学习之间的交集,目的是开发可使机器具有自主掌握执行复杂任务技能的算法和技术。尤其对如何将学习用于掌握...翻译 2020-12-14 11:40:34 · 95 阅读 · 0 评论 -
15. 2020年秋季UC Berkeley CS285《深度强化学习》第4课:强化学习导论_5/6【中英字幕】
15. 2020年秋季UC Berkeley CS285《深度强化学习》第4课:强化学习导论 https://www.bilibili.com/video/BV14K411V7Fb谢尔盖·莱文(Sergey Levine)加州大学伯克利分校电气工程和计算机科学系助理教授。专注于控制和机器学习之间的交集,目的是开发可使机器具有自主掌握执行复杂任务技能的算法和技术。尤其对如何将学习用于掌握...翻译 2020-12-01 12:21:06 · 132 阅读 · 0 评论 -
14. 2020年秋季UC Berkeley CS285《深度强化学习》第4课:强化学习导论_4/6【中英字幕】
14. 2020年秋季UC Berkeley CS285《深度强化学习》第4课:强化学习导论 https://www.bilibili.com/video/BV1Hy4y1q74T谢尔盖·莱文(Sergey Levine)加州大学伯克利分校电气工程和计算机科学系助理教授。专注于控制和机器学习之间的交集,目的是开发可使机器具有自主掌握执行复杂任务技能的算法和技术。尤其对如何将学习用于掌握...翻译 2020-11-29 11:37:15 · 103 阅读 · 0 评论 -
13. 2020年秋季UC Berkeley CS285《深度强化学习》第4课:强化学习导论_3/6【中英字幕】
13. 2020年秋季UC Berkeley CS285《深度强化学习》第4课:强化学习导论 https://www.bilibili.com/video/BV14a4y1W7wf谢尔盖·莱文(Sergey Levine)加州大学伯克利分校电气工程和计算机科学系助理教授。专注于控制和机器学习之间的交集,目的是开发可使机器具有自主掌握执行复杂任务技能的算法和技术。尤其对如何将学习用于掌握...翻译 2020-11-27 11:42:20 · 143 阅读 · 0 评论 -
12. 2020年秋季UC Berkeley CS285《深度强化学习》第4课:强化学习导论_2/6【中英字幕】
12. 2020年秋季UC Berkeley CS285《深度强化学习》第4课:强化学习导论 https://www.bilibili.com/video/BV1BD4y1X7za谢尔盖·莱文(Sergey Levine)加州大学伯克利分校电气工程和计算机科学系助理教授。专注于控制和机器学习之间的交集,目的是开发可使机器具有自主掌握执行复杂任务技能的算法和技术。尤其对如何将学习用于掌握...翻译 2020-11-25 11:42:26 · 157 阅读 · 0 评论 -
11. 2020年秋季UC Berkeley CS285《深度强化学习》第4课:强化学习导论_1/6【中英字幕】
11. 2020年秋季UC Berkeley CS285《深度强化学习》第4课:强化学习导论 https://www.bilibili.com/video/BV1CK4y1Z7ZW谢尔盖·莱文(Sergey Levine)加州大学伯克利分校电气工程和计算机科学系助理教授。专注于控制和机器学习之间的交集,目的是开发可使机器具有自主掌握执行复杂任务技能的算法和技术。尤其对如何将学习用于掌握...翻译 2020-11-24 15:41:40 · 210 阅读 · 0 评论 -
10. 2020年秋季UC Berkeley CS285《深度强化学习》第2课:行为监督学习_6/6【中英字幕】
10. 2020年秋季UC Berkeley CS285《深度强化学习》第2课:行为监督学习 https://www.bilibili.com/video/BV1Tf4y1v7Da谢尔盖·莱文(Sergey Levine)加州大学伯克利分校电气工程和计算机科学系助理教授。专注于控制和机器学习之间的交集,目的是开发可使机器具有自主掌握执行复杂任务技能的算法和技术。尤其对如何将学习用于掌握...翻译 2020-11-22 11:30:12 · 132 阅读 · 0 评论 -
9. 2020年秋季UC Berkeley CS285《深度强化学习》第2课:行为监督学习_5/6【中英字幕】
9. 2020年秋季UC Berkeley CS285《深度强化学习》第2课:行为监督学习 https://www.bilibili.com/video/BV1yA411j7Zk谢尔盖·莱文(Sergey Levine)加州大学伯克利分校电气工程和计算机科学系助理教授。专注于控制和机器学习之间的交集,目的是开发可使机器具有自主掌握执行复杂任务技能的算法和技术。尤其对如何将学习用于掌握复...翻译 2020-11-19 14:26:45 · 85 阅读 · 0 评论 -
8. 2020年秋季UC Berkeley CS285《深度强化学习》第2课:行为监督学习_4/6【中英字幕】
8. 2020年秋季UC Berkeley CS285《深度强化学习》第2课:行为监督学习 https://www.bilibili.com/video/BV1KD4y1X7WF/谢尔盖·莱文(Sergey Levine)加州大学伯克利分校电气工程和计算机科学系助理教授。专注于控制和机器学习,目的是开发可使机器具有自主掌握执行复杂任务技能的算法和技术。尤其对如何将学习用于掌握复杂的行为...翻译 2020-11-16 12:07:38 · 87 阅读 · 0 评论 -
7. 2020年秋季UC Berkeley CS285《深度强化学习》第2课:行为监督学习_3/6【中英字幕】
7. 2020年秋季UC Berkeley CS285《深度强化学习》第2课:行为监督学习 https://www.bilibili.com/video/BV1JD4y1X78i/谢尔盖·莱文(Sergey Levine)加州大学伯克利分校电气工程和计算机科学系助理教授。专注于控制和机器学习,目的是开发可使机器具有自主掌握执行复杂任务技能的算法和技术。尤其对如何将学习用于掌握复杂的行为...翻译 2020-11-15 16:49:53 · 105 阅读 · 0 评论 -
6. 2020年秋季UC Berkeley CS285《深度强化学习》第2课:行为监督学习_2/6【中英字幕】
6. 2020年秋季UC Berkeley CS285《深度强化学习》第2课:行为监督学习 https://www.bilibili.com/video/BV1Y54y1z7VM/谢尔盖·莱文(Sergey Levine)加州大学伯克利分校电气工程和计算机科学系助理教授。专注于控制和机器学习之间的交集,目的是开发可使机器具有自主掌握执行复杂任务技能的算法和技术。尤其对如何将学习用于掌握...翻译 2020-11-14 14:53:39 · 79 阅读 · 0 评论 -
5. 2020年秋季UC Berkeley CS285《深度强化学习》第2课:行为监督学习_1/6【中英字幕】
5. 2020年秋季UC Berkeley CS285《深度强化学习》第2课:行为监督学习 https://www.bilibili.com/video/BV1My4y1z7PD/谢尔盖·莱文(Sergey Levine)加州大学伯克利分校电气工程和计算机科学系助理教授。专注于控制和机器学习之间的交集,目的是开发可使机器具有自主掌握执行复杂任务技能的算法和技术。尤其对如何将学习用于掌握...翻译 2020-11-13 19:25:23 · 96 阅读 · 0 评论 -
4. 2020年秋季UC Berkeley CS285《深度强化学习》第1课:简介和课程概述_4/4【中英字幕】
4. 2020年秋季UC Berkeley CS285《深度强化学习》第1课:简介和课程概述 https://www.bilibili.com/video/BV1ZZ4y1V7hy/谢尔盖·莱文(Sergey Levine)加州大学伯克利分校电气工程和计算机科学系助理教授。专注于控制和机器学习之间的交集,目的是开发可使机器具有自主掌握执行复杂任务技能的算法和技术。尤其对如何将学习用于掌...翻译 2020-11-07 11:36:17 · 1163 阅读 · 0 评论 -
3. 2020年秋季UC Berkeley CS285《深度强化学习》第1课:简介和课程概述_3/4【中英字幕】
3. 2020年秋季UC Berkeley CS285《深度强化学习》第1课:简介和课程概述 https://www.bilibili.com/video/BV16Z4y1V7m1/谢尔盖·莱文(Sergey Levine)加州大学伯克利分校电气工程和计算机科学系助理教授。专注于控制和机器学习之间的交集,目的是开发可使机器具有自主掌握执行复杂任务技能的算法和技术。尤其对如何将学习用于掌...翻译 2020-11-05 10:03:06 · 704 阅读 · 0 评论 -
2. 2020年秋季UC Berkeley CS285《深度强化学习》第1课:简介和课程概述_2/4【中英字幕】
2. 2020年秋季UC Berkeley CS285《深度强化学习》第1课:简介和课程概述 https://www.bilibili.com/video/BV1LK411P75v/谢尔盖·莱文(Sergey Levine)加州大学伯克利分校电气工程和计算机科学系助理教授。专注于控制和机器学习之间的交集,目的是开发可使机器具有自主掌握执行复杂任务技能的算法和技术。尤其对如何将学习用于掌...翻译 2020-11-04 10:18:49 · 173 阅读 · 0 评论 -
1. 2020年秋季《UC Berkeley CS285深度强化学习》第1课:简介和课程概述_1/4【中英文双字幕】
1. 2020年秋季《UC Berkeley CS285深度强化学习》第1课:简介和课程概述 https://www.bilibili.com/video/BV1Pt4y1e7Td/谢尔盖·莱文(Sergey Levine)加州大学伯克利分校电气工程和计算机科学系助理教授。专注于控制和机器学习之间的交集,开发可使机器具有自主掌握执行复杂任务技能的算法和技术。尤其对如何将学习用于掌握复杂...翻译 2020-11-03 19:42:28 · 196 阅读 · 0 评论 -
14. 2019年《斯坦福大学CS330多任务和元学习》第14讲:学生论文评论【中英文双字幕】
2019年《斯坦福大学CS330多任务和元学习》第14讲:学生论文评论【中英文双字幕】 https://www.bilibili.com/video/BV1PK411P7Ca/斯坦福大学切尔西·芬恩(Chelsea Finn)助理教授http://cs330.stanford.edu/要获取斯坦福大学即将推出的人工智能专业计划的最新消息,请访问:http://learn.stanf...翻译 2020-11-02 18:57:33 · 93 阅读 · 0 评论 -
13. 2019年《斯坦福大学CS330多任务和元学习》第13讲:学生论文评论【中英文双字幕】
2019年《斯坦福大学CS330多任务和元学习》第13讲:学生论文评论【中英文双字幕】 https://www.bilibili.com/video/BV1f541157K9/斯坦福大学切尔西·芬恩(Chelsea Finn)助理教授http://cs330.stanford.edu/要获取斯坦福大学即将推出的人工智能专业计划的最新消息,请访问:http://learn.stanf...翻译 2020-11-01 11:16:14 · 219 阅读 · 0 评论 -
12. 2019年《斯坦福大学CS330多任务和元学习》第12讲:前沿与公开挑战【中英文双字幕】
2019年《斯坦福大学CS330多任务和元学习》第12讲:前沿与公开挑战【中英文双字幕】 https://www.bilibili.com/video/BV1HD4y197Ui/斯坦福大学切尔西·芬恩(Chelsea Finn)助理教授http://cs330.stanford.edu/要获取斯坦福大学即将推出的人工智能专业计划的最新消息,请访问:http://learn.stan...翻译 2020-10-29 12:04:40 · 122 阅读 · 0 评论 -
11. 2019年《斯坦福大学CS330多任务和元学习》第11讲: Sergey Levine (UC Berkeley)【中英文双字幕】
2019年《斯坦福大学CS330多任务和元学习》第11讲: Sergey Levine (UC Berkeley)【中英文双字幕】 https://www.bilibili.com/video/BV1e5411L7Do/斯坦福大学切尔西·芬恩(Chelsea Finn)助理教授http://cs330.stanford.edu/要获取斯坦福大学即将推出的人工智能专业计划的最新消息,...翻译 2020-10-27 11:28:03 · 163 阅读 · 0 评论 -
10. 2019年《斯坦福大学CS330多任务和元学习》第10讲: Jeff Clune (Uber AI Labs)【中英文双字幕】
2019年《斯坦福大学CS330多任务和元学习》第10讲: Jeff Clune (Uber AI Labs)【中英文双字幕】 https://www.bilibili.com/video/BV1Qr4y1c7YE/斯坦福大学切尔西·芬恩(Chelsea Finn)助理教授http://cs330.stanford.edu/要获取斯坦福大学即将推出的人工智能专业计划的最新消息,请访...翻译 2020-10-26 15:43:45 · 143 阅读 · 0 评论 -
9. 2019年《斯坦福大学CS330多任务和元学习》第9讲:终身学习【中英文双字幕】
2019年《斯坦福大学CS330多任务和元学习》第9讲:终身学习【中英文双字幕】 https://www.bilibili.com/video/BV15A411j7Kb/斯坦福大学切尔西·芬恩(Chelsea Finn)助理教授http://cs330.stanford.edu/要获取斯坦福大学即将推出的人工智能专业计划的最新消息,请访问:http://learn.stanford...翻译 2020-10-25 07:52:58 · 224 阅读 · 0 评论 -
8. 2019年《斯坦福大学CS330多任务和元学习》第8讲:基于模型的强化学习【中英文双字幕】
2019年《斯坦福大学CS330多任务和元学习》第8讲:基于模型的强化学习【中英文双字幕】 https://www.bilibili.com/video/BV1RK411A7bT/斯坦福大学切尔西·芬恩(Chelsea Finn)助理教授http://cs330.stanford.edu/要获取斯坦福大学即将推出的人工智能专业计划的最新消息,请访问:http://learn.sta...翻译 2020-10-24 12:26:32 · 162 阅读 · 0 评论 -
7. 2019年《斯坦福大学CS330多任务和元学习》第7讲:Kate Rakelly (UC Berkeley)【中英文双字幕】
2019年《斯坦福大学CS330多任务和元学习》第7讲:Kate Rakelly (UC Berkeley)【中英文双字幕】 https://www.bilibili.com/video/BV1CK4y1h71m/斯坦福大学切尔西·芬恩(Chelsea Finn)助理教授http://cs330.stanford.edu/要获取斯坦福大学即将推出的人工智能专业计划的最新消息,请访问...翻译 2020-10-23 08:30:35 · 123 阅读 · 0 评论 -
6. 2019年《斯坦福大学CS330多任务和元学习》第6讲:强化学习入门【中文字幕】
2019年《斯坦福大学CS330多任务和元学习》第6讲:强化学习入门【中文字幕】 https://www.bilibili.com/video/BV1K541187cJ/斯坦福大学切尔西·芬恩(Chelsea Finn)助理教授http://cs330.stanford.edu/要获取斯坦福大学即将推出的人工智能专业计划的最新消息,请访问:http://learn.stanford...翻译 2020-10-22 14:37:40 · 758 阅读 · 0 评论 -
5. 2019年《斯坦福大学CS330多任务和元学习》第5讲:贝叶斯元学习【中文字幕】
[2019年《斯坦福大学CS330多任务和元学习》第5讲:贝叶斯元学习【中文字幕】) https://www.bilibili.com/video/BV1Yt4y1S7tk/斯坦福大学切尔西·芬恩(Chelsea Finn)助理教授http://cs330.stanford.edu/要获取斯坦福大学即将推出的人工智能专业计划的最新消息,请访问:http://learn.stanfo...翻译 2020-10-21 20:21:56 · 3189 阅读 · 0 评论 -
4. 2019年《斯坦福大学CS330多任务和元学习》第4讲:非参数元学习【中文字幕】
[2019年《斯坦福大学CS330多任务和元学习》第4讲:非参数元学习【中文字幕】](https://www.bilibili.com/video/BV1664y1c7jG/) 斯坦福大学切尔西·芬恩(Chelsea Finn)助理教授http://cs330.stanford.edu/要获取斯坦福大学即将推出的人工智能专业计划的最新消息,请访问:http://learn.stanf...翻译 2020-10-12 11:39:20 · 340 阅读 · 0 评论 -
3. 2019年《斯坦福大学CS330多任务和元学习》第3讲:基于优化的元学习【中文字幕】
[2019年《斯坦福大学CS330多任务和元学习》第3讲:基于优化的元学习【中文字幕】](https://www.bilibili.com/video/BV1uh411d7vj/) 斯坦福大学切尔西·芬恩(Chelsea Finn)助理教授http://cs330.stanford.edu/要获取斯坦福大学即将推出的人工智能专业计划的最新消息,请访问:http://learn.sta...翻译 2020-09-25 13:04:50 · 251 阅读 · 0 评论 -
2. 2019年《斯坦福大学CS330多任务和元学习》第2讲:多任务和元学习基础【中文字幕】
[2019年《斯坦福大学CS330多任务和元学习》第2讲:多任务和元学习基础【中文字幕】](https://www.bilibili.com/video/BV17a4y1J7eG/) 斯坦福大学切尔西·芬恩(Chelsea Finn)助理教授http://cs330.stanford.edu/要获取斯坦福大学即将推出的人工智能专业计划的最新消息,请访问:http://learn.st...翻译 2020-08-24 17:09:01 · 2431 阅读 · 0 评论 -
1. 2019年《斯坦福大学CS330多任务和元学习》第1讲:简介与概述【中文字幕】
[2019年《斯坦福大学CS330多任务和元学习》第1讲:简介与概述【中文字幕】](https://www.bilibili.com/video/BV1564y1c71b/) 斯坦福大学切尔西·芬恩(Chelsea Finn)助理教授http://cs330.stanford.edu/要获取斯坦福大学即将推出的人工智能专业计划的最新消息,请访问:http://learn.stanfo...翻译 2020-08-15 13:39:56 · 443 阅读 · 0 评论 -
1. 2020年《DeepMind&UCL深度学习讲座》第1讲:机器学习和AI入门【中文字幕】
1. 2020年DeepMind&UCL_深度学习讲座_机器学习和AI入门 在此讲座中,DeepMind研究科学家和UCL教授Thore Graepel解释了DeepMind基于机器学习的AI方法。 他举例说明了如何结合使用深度学习和强化学习来构建智能系统,包括AlphaGo,Capture The Flag和AlphaStar。 接下来是对不同主题的简短介绍,并在随后的讲座中演讲者。...翻译 2020-06-22 20:27:45 · 455 阅读 · 0 评论