深入浅出理解卷积Convolutional原理和深度学习过程中CNN神经网络机理

Striding:卷积时,通常希望输出的尺寸是比原输入更低。这在CNN中很常见,在增加信道数量的同时空间尺寸减小。其中一种方法是使用池化层(例如,取每 2×2网格的平均值/最大值将空间维度减半)。还有一种方法是使用 Strides:

Strides的思路是改变卷积核移动的步长跳过一些像素。Stride 是 1 表示卷积核滑过每一个相距是 1 的像素,是最基本的单步滑动,即经典的标准卷积模式。Stride 是2表示卷积核的移动步长是2,跳过相邻像素,图像缩小为原来的1/2。Stride是3表示卷积核的移动步长是 3,跳过2个相邻像素,图像缩小为原来的1/3。

越来越多的新型神经网络结构,已完全抛弃了池化层。当需要对图像进行缩小时会采用 Stride方法。

多通道

上面所述基于单个输入通道的图像。实际上,现在绝大多数输入图像都是3通道的,一张彩色图片由R、G、B三个维度的值表述。通道数只会增加网络深度。通常会将图像的通道视作一个整体,强调其整体的一面而不关注各自的差异。

滤波器:卷积核的集合

滤波器和卷积核两个术语之间有着本质的区别:仅在1通道情况下,滤波器和卷积核这两个术语等价,在一般情况下,它们是不同的。每个滤波器实际上是卷积核的集合,图层的每个输入通道都有一个卷积核,并且是唯一的。

卷积层中的每个滤波器都只输出一个通道,他们是这样实现的:

滤波器的每个卷积核在各自的输入通道上滑动,产生各自的计算结果。一些卷积核可能比其他卷积核具有更大的权重,以便比某些卷积核更强调某些输入通道(例如,滤波器的红色通道卷积核可能比其他通道的卷积核有更大的权重,因此,对红色通道特征的反应要强于其他通道)。

然后将每个通道处理的结果汇在一起形成一个通道。滤波器的卷积核各自产生一个对应通道的输出,最后整个滤波器产生一个总的输出通道。

偏置。偏置的作用是对每个输出滤波器增加偏置项以便产生最终输出通道。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值