- 博客(5)
- 收藏
- 关注
转载 一文读懂 深度强化学习算法 A3C (Actor-Critic Algorithm)
一文读懂 深度强化学习算法 A3C (Actor-Critic Algorithm)2017-12-25 16:29:19 对于 A3C 算法感觉自己总是一知半解,现将其梳理一下,记录在此,也给想学习的小伙伴一个参考。 想要认识清楚这个算法,需要对 DRL 的算法有比较深刻的了解,推荐大家先了解下 Deep Q-learning 和 Policy Gra...
2017-12-25 16:47:00 2542
转载 18 Issues in Current Deep Reinforcement Learning from ZhiHu
深度强化学习的18个关键问题from:https://zhuanlan.zhihu.com/p/3215360385 人赞了该文章深度强化学习的问题在哪里?未来怎么走?哪些方面可以突破?这两天我阅读了两篇篇猛文A Brief Survey of Deep Reinforcement Learning 和 Deep Reinforc...
2017-12-21 09:13:00 268
转载 Graph Convolutional Networks (GCNs) 简介
Graph Convolutional Networks2018-01-16 19:35:17this Tutorial comes from YouTube Video:https://www.youtube.com/watch?v=0_O8PdZBc5s&t=2097s 之所以这个方面的研究会吸引人,是因为这个东西可以将很多知识联系起来。现实生活中,...
2017-12-18 21:42:00 317
转载 (转)ResNet, AlexNet, VGG, Inception: Understanding various architectures of Convolutional Networks...
ResNet, AlexNet, VGG, Inception: Understanding various architectures of Convolutional NetworksbyKOUSTUBH this blog from: http://cv-tricks.com/cnn/understand-resnet-alexnet-vg...
2017-12-17 20:27:00 195
转载 深度学习课程笔记(七):模仿学习(imitation learning)
深度学习课程笔记(七):模仿学习(imitation learning)2017.12.10 本文所涉及到的 模仿学习,则是从给定的展示中进行学习。机器在这个过程中,也和环境进行交互,但是,并没有显示的得到 reward。在某些任务上,也很难定义 reward。如:自动驾驶,撞死一人,reward为多少,撞到一辆车,reward 为多少,撞到小动物,reward...
2017-12-10 11:04:00 1236
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人