2017年12月_a1424262219

12月 11月 10月 09月 08月 07月 06月 05月 04月 03月 02月 01月

转载一文读懂深度强化学习算法 A3C （Actor-Critic Algorithm）

一文读懂深度强化学习算法 A3C （Actor-Critic Algorithm）2017-12-25 16:29:19　　对于 A3C 算法感觉自己总是一知半解，现将其梳理一下，记录在此，也给想学习的小伙伴一个参考。　　想要认识清楚这个算法，需要对 DRL 的算法有比较深刻的了解，推荐大家先了解下 Deep Q-learning 和 Policy Gra...

2017-12-25 16:47:00 2542

转载 18 Issues in Current Deep Reinforcement Learning from ZhiHu

深度强化学习的18个关键问题from:https://zhuanlan.zhihu.com/p/3215360385 人赞了该文章深度强化学习的问题在哪里？未来怎么走？哪些方面可以突破？这两天我阅读了两篇篇猛文A Brief Survey of Deep Reinforcement Learning 和 Deep Reinforc...

2017-12-21 09:13:00 268

转载 Graph Convolutional Networks (GCNs) 简介

Graph Convolutional Networks2018-01-16 19:35:17this Tutorial comes from YouTube Video：https://www.youtube.com/watch?v=0_O8PdZBc5s&t=2097s 之所以这个方面的研究会吸引人，是因为这个东西可以将很多知识联系起来。现实生活中，...

2017-12-18 21:42:00 317

转载（转）ResNet, AlexNet, VGG, Inception: Understanding various architectures of Convolutional Networks...

ResNet, AlexNet, VGG, Inception: Understanding various architectures of Convolutional NetworksbyKOUSTUBH　　this blog from:　http://cv-tricks.com/cnn/understand-resnet-alexnet-vg...

2017-12-17 20:27:00 195

转载深度学习课程笔记（七）：模仿学习（imitation learning）

深度学习课程笔记（七）：模仿学习（imitation learning）2017.12.10　　　　本文所涉及到的模仿学习，则是从给定的展示中进行学习。机器在这个过程中，也和环境进行交互，但是，并没有显示的得到 reward。在某些任务上，也很难定义 reward。如：自动驾驶，撞死一人，reward为多少，撞到一辆车，reward 为多少，撞到小动物，reward...

2017-12-10 11:04:00 1236

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

转载 一文读懂 深度强化学习算法 A3C （Actor-Critic Algorithm）

转载 18 Issues in Current Deep Reinforcement Learning from ZhiHu

转载 Graph Convolutional Networks (GCNs) 简介

转载 （转）ResNet, AlexNet, VGG, Inception: Understanding various architectures of Convolutional Networks...

转载 深度学习课程笔记（七）：模仿学习（imitation learning）

空空如也

空空如也

转载一文读懂深度强化学习算法 A3C （Actor-Critic Algorithm）

转载（转）ResNet, AlexNet, VGG, Inception: Understanding various architectures of Convolutional Networks...

转载深度学习课程笔记（七）：模仿学习（imitation learning）