卷积神经网络CNN

卷积神经网络

基本框架

在这里插入图片描述
上图为LeCun Y, Bottou L, Bengio Y, et al. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE, 1998, 86(11): 2278-2324.中提出的-LeNet-5的框架,后续的卷积神经网络基本都是在此基础上进行改动和扩展的。
在这里插入图片描述
输入图像会经过卷积层、池化层和全连接层,最终得到输出结果。我们可以对其进行这样简单的理解:卷积层用于提取特征、池化层为了减少参数量进行下采样,全连接层将之前提取的特征展成一维,通过一些很难理解的玄学操作得到最终的结果。
在这里插入图片描述
最终的结果可以是对图像进行判定。
在这里插入图片描述
比如判定这张图片是不是猫。
在这里插入图片描述
也可以是对其进行分类,计算出其是各种动物的概率,输出可能性最大的结果。
下面是每一层步骤的详细过程。

卷积层

在这里插入图片描述
卷积层是通过卷积核对图像进行遍历,输出遍历到的对应位置与卷积核的对应位置的相乘后的和,生成feature map。
在这里插入图片描述
上图为步长为1进行卷积的过程。
在这里插入图片描述
每次与卷积核进行卷积的图像部分被称为感受野。
在这里插入图片描述
如上图所示,一张5x5的图像通过2x2的卷积核卷积以后,生成的feature map的大小为4x4。
在进行卷积的时候,边缘的像素块只进行了一次运算,而内部像素却进行了多次运算。边缘的像素块的地位与内部像素是一样的,运算次数却不同,这不利于更好的提取特征。
在这里插入图片描述
因此,一般通过对外圈补0后再进行卷积。这样生成的feature map和原图像大小相同。
在这里插入图片描述
对于彩色图像,也会有针对对每一层卷积的卷积核进行卷积,并将每一次卷积出的结果赋予不同的权值生成最终的feature map。
在这里插入图片描述
以下图举例,使用下面的卷积核可以将图像中的三角形特征提取出来。
在这里插入图片描述
使用提取眼镜、鼻子、耳朵、嘴唇等作为卷积核可以提取出人脸的这一部分特征。
在这里插入图片描述
利用如下所示卷积核可以将图像的边缘特征提取出来。
在这里插入图片描述
可以看到,通过不同的卷积核,可以对图像不同的特征进行提取。

池化层

为了减少参数量,避免过拟合,同时实现平移不变性,在卷积层之后要进入池化层。
在这里插入图片描述
上图的最大池化就是选取区域内的最大值。经过池化后的feature map会变小。
在这里插入图片描述
如上图,即使第三行特征经过平移,使用相同的卷积核卷积后再进行池化,仍然可以得到的同样的结果。这就是平移不变性。

全连接层

与卷积的每次只针对当前的感受野不同,全连接层会将数据展成一维,且每一个数据都与下一层所有数据相连。
在这里插入图片描述
以一个人的图像为例。将眼镜、鼻子、耳朵和嘴巴的特征提取通过卷积出来以后,进入池化层下采样,然后通过全连接层进行最后的判断。
在这里插入图片描述

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值