??? R.I.P for Kobe?-CSDN博客

原创基于CNN 的单路口路网程序分析——CNN篇

0.学习目标学习什么是卷积神经网络(CNN)结合单路口程序实例，更加深入理解DQN原理1.卷积神经网络(CNN)1.1 为什么使用卷积神经网络？作为人工神经网络(ANN)的一个推广和延申，卷积神经网络已经被证明是图像识别领域最有效的工具。就本例而言，我们从SUMO.gui界面直接读取像素点，这是一个高维的输入。卷积神经网络可以很好的完成自动提取特征、降维处理数据输入等任务。1.2 ...

2020-05-01 16:37:57 227

原创彻底搞懂tensorflow里的张量(tensor)

彻底搞懂tensorflow里的张量(tensor)1.引言学习卷积神经网络(CNN)的时候，最重要的就是搞清楚网络各层的神经元输入输出的数据结构(即张量)。如果仅用线性代数所学的矩阵，向量来理解张量，一定会搞得一头雾水。因此很有必要搞清楚张量是什么东西。首先明确：张量最主要的两个参数： rank（阶，或维数）、shape（形状）2.什么是张量下图是张量的直观的示意：张量是标量、...

2020-04-29 02:40:41 2551 1

转载深度增强学习（DRL）漫谈 - 从DQN到AlphaGo

本文转载自：https://blog.csdn.net/jinzhuojun/article/details/52752561深度增强学习（DRL）漫谈 - 从DQN到AlphaGo深度增强学习（Deep reinforcement learning, DRL）是DeepMind（后被谷歌收购）近几近来重点研究且发扬光大的机器学习算法框架。两篇Nature上的奠基性论文（DQN和AlphaGo...

2020-04-27 19:30:15 388

原创论文阅读笔记 | 用深度强化学习玩Atari

论文阅读笔记 | 用深度强化学习玩AtariAbstract使用强化学习从高维感官输入直接学习控制策略的深度学习模型。该模型是一个卷积神经网络，使用Q-learning的变体进行训练，输入为原始像素，输出为估计未来报酬的值函数。全新的界面设计，将会带来全新的写作体验；在创作中心设置你喜爱的代码高亮样式，Markdown 将代码片显示选择的高亮样式进行展示；增加了图片拖拽功能，...

2020-04-26 11:54:36 1052

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 基于CNN 的单路口路网程序分析——CNN篇

原创 彻底搞懂tensorflow里的张量(tensor)

转载 深度增强学习（DRL）漫谈 - 从DQN到AlphaGo

原创 论文阅读笔记 | 用深度强化学习玩Atari

空空如也

空空如也

原创基于CNN 的单路口路网程序分析——CNN篇

原创彻底搞懂tensorflow里的张量(tensor)

转载深度增强学习（DRL）漫谈 - 从DQN到AlphaGo

原创论文阅读笔记 | 用深度强化学习玩Atari