【无标题】

【1】原文
DRL是将深度学习(DL)与强化学习(RL)结合,直接从高维原始数据学习控制策略
DQN是DRL的其中一种算法,它要做的就是将卷积神经网络(CNN)和Q-Learning结合起来,CNN的输入是原始图像数据(作为状态State),输出则是每个动作Action对应的价值评估Value Function(Q值)。

【2】原文
在二维卷积层中,一个二维输入数组和一个二维核(kernel)数组通过互相关运算输出一个二维数组。
在这里插入图片描述
二维卷积层将输入和卷积核做互相关运算,并加上一个标量偏差来得到输出。
卷积层的模型参数包含了卷积核和标量偏差。我们在训练模型的时候,通常先对卷积层进行随机的初始化,然后不断迭代卷积核和偏差。

卷积窗口形状为 p × q 的卷积层称为 p × q 卷积层。

二维卷积层输出的二维数组可以看做是输入在空间维度上(宽和高)上某一级的表征,也叫特征图(feature map)。

【3】原文
CNN优缺点

【4】
CV,计算机视觉 Computer Vision

RGB,RGB色彩模式(也翻译为“红绿蓝”,比较少用)是工业界的一种颜色标准,是通过对红®、绿(G)、蓝(B)三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色的,RGB即是代表红、绿、蓝三个通道的颜色,这个标准几乎包括了人类视力所能感知的所有颜色,是目前运用最广的颜色系统之一。

【5】原文:分类与回归
分类问题输出的是物体所属的类别,回归问题输出的是物体的值。

天气可以分为:晴、阴、雨 三类,我们会测明天及以后几天的天气情况,如明天阴,这就是分类
我们知道今天及以前几天的温度,我们预测现在往后的温度,每一个时刻,我们都能预测出一个温度值,就是回归

【6】原文:神经网络的输入输出

【7】原文
卷积核(kernel):用于对输入图像进行共享权值的遍历;如果将图像每一个图像的每一个像素作为卷积输入层的元素,那么卷积核就相当与每个输入的权值,且有卷积核大小的一组输入使用同一组权值。例如,一个图像是99大小,卷积核是33;则输入是81个,共享权值是9个一组。

字符含义:i:输入的宽度,k:卷积核的宽度,p:单边填充宽度,o:输出宽度,s:步长

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值