卷积神经网络

卷积神经网络(Convolutional Neural Network,CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于图像处理有出色表现。它包括卷积层,池化层和全连接层。

深度学习卷积的重要概念

卷积核(Convolution Kernel),根据一定规则进行图片扫描并进行卷积计算的对象称为卷积核。卷积核可以提取局部特征。

卷积核尺寸(Kernel Size),卷积核是一个3维的矩阵,可以用一个立方体图示,宽w,高h,深度d。深度d由输入的通道数决定,一般描述卷积核尺寸时,可以只描述宽w和高h。

特征图(Feature Map),经过卷积核卷积过后得到的结果矩阵就是特征图。每一个卷积核会得到一层特征图,有多个卷积核则会得到多层的卷积图。

特征图尺寸(Feature Map Size),特征图也是一个3维的矩阵,可以用一个立方体图示,宽w,高h,深度d。深度d由当前层的卷积核个数决定,一般描述特征图尺寸时,可以只描述宽w和高h。

步长(Stride),卷积核在输入图像上滑动的跨度。如果卷积核一次移动一个像素,我们称其步长为1。

零填充(Padding),为了提取图像边缘的信息,并且保证输出特征图的尺寸满足要求,可以对输入图像边缘填充一个全为0的边框,边框的像素宽度就是padding。

参数共享,对输入的照片,用一个或者多个filter扫描照片,filter自带的参数就是权重,在同一个filter扫描的图层当中,每个filter使用同样的参数进行加权计算。

多通道卷积

在卷积神经网络里,通道又分输入通道和输出通道。

输入通道:如是彩色图片,起始的输入通道就是3。如是中间层的卷积,输入通道就是上一层的输出通道个数,计算方法是,每个输入通道的图片都使用同一个卷积核进行卷积操作,生成与输入通道匹配的feature map(比如彩色图片就是3个),然后再把这几张feature map相同位置上的值加起来,生成一张feature map。

输出通道:想要输出几个feature map,就放几个卷积核,就是几个输出通道。

可分卷积

某些神经网络架构使用了可分卷积,比如MobileNets。可分卷积有空间可分卷积和深度可分卷积。

1.空间可分卷积是将一个卷积分解为两个单独的运算。对于下面的示例,3×3 的核被分成了一个3×1 核和一个1×3核。在卷积中,3×3 核直接与图像卷积。在空间可分卷积中,3×1 核首先与图像卷积,然后再应用1×3 核。这样,执行同样的操作时仅需6 个参数,而不是9 个。

2.深度可分卷积的计算分为两部分,首先对通道(深度)分别进行空间卷积,并对输出进行拼接,随后使用单位卷积核进行通道卷积已得到特征图。

池化的基本操作和原理

池化层主要的作用是下采样,通过去掉Feature Map中不重要的样本,进一步减少参数数量。Pooling的方法很多,最常用的是Max Pooling。Max Pooling实际上就是在n*n的样本中取最大值,作为采样后的样本值。

1.除了Max Pooing之外,常用的还有Average Pooling-取各样本的平均值。

2.对于深度为D的Feature Map,各层独立做Pooling,因此Pooling后的深度仍然为D。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值