- 博客(4)
- 收藏
- 关注
原创 基于CNN 的单路口路网程序分析——CNN篇
0.学习目标学习什么是卷积神经网络(CNN)结合单路口程序实例,更加深入理解DQN原理1.卷积神经网络(CNN)1.1 为什么使用卷积神经网络?作为人工神经网络(ANN)的一个推广和延申,卷积神经网络已经被证明是图像识别领域最有效的工具。就本例而言,我们从SUMO.gui界面直接读取像素点,这是一个高维的输入。卷积神经网络可以很好的完成自动提取特征、降维处理数据输入等任务。1.2 ...
2020-05-01 16:37:57 227
原创 彻底搞懂tensorflow里的张量(tensor)
彻底搞懂tensorflow里的张量(tensor)1.引言学习卷积神经网络(CNN)的时候,最重要的就是搞清楚网络各层的神经元输入输出的数据结构(即张量)。如果仅用线性代数所学的矩阵,向量来理解张量,一定会搞得一头雾水。因此很有必要搞清楚张量是什么东西。首先明确:张量最主要的两个参数: rank(阶,或维数)、shape(形状)2.什么是张量下图是张量的直观的示意:张量是标量、...
2020-04-29 02:40:41 2551 1
转载 深度增强学习(DRL)漫谈 - 从DQN到AlphaGo
本文转载自:https://blog.csdn.net/jinzhuojun/article/details/52752561深度增强学习(DRL)漫谈 - 从DQN到AlphaGo深度增强学习(Deep reinforcement learning, DRL)是DeepMind(后被谷歌收购)近几近来重点研究且发扬光大的机器学习算法框架。两篇Nature上的奠基性论文(DQN和AlphaGo...
2020-04-27 19:30:15 388
原创 论文阅读笔记 | 用深度强化学习玩Atari
论文阅读笔记 | 用深度强化学习玩AtariAbstract使用强化学习从高维感官输入直接学习控制策略的深度学习模型。该模型是一个卷积神经网络,使用Q-learning的变体进行训练,输入为原始像素,输出为估计未来报酬的值函数。全新的界面设计 ,将会带来全新的写作体验;在创作中心设置你喜爱的代码高亮样式,Markdown 将代码片显示选择的高亮样式 进行展示;增加了 图片拖拽 功能,...
2020-04-26 11:54:36 1052
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人