使用CNN实现图像分类——理解卷积神经网络（卷积、池化、全连接）

最新推荐文章于 2024-07-25 18:25:30 发布

网络安全研发随想

最新推荐文章于 2024-07-25 18:25:30 发布

阅读量8.9k

点赞数 4

分类专栏： AI

本文链接：https://blog.csdn.net/gengzhikui1992/article/details/104452809

版权

AI 专栏收录该内容

6 篇文章 2 订阅

订阅专栏

1. 卷积神经网络（CNN）简介

19世纪60年代，科学家通过对猫的视觉皮层细胞研究发现，每一个视觉神经元只会处理一小块区域的视觉图像，即感受野（Receptive Field）。卷积神经网络的概念即出自于此。简单说这样做保留了图像的空间信息。

2012年是卷积神经网络崛起之年。这一年，Alex Krizhevsky带着卷积神经网络参加了ImageNet竞赛（其重要程度相当于奥运会）并一鸣惊人，将识别错误率从26%降到了15%。

从那开始，很多公司开始使用深度学习作为他们服务的核心。比如，Facebook在他们的自动标记算法中使用了它，Google在照片搜索中使用了，Amazon在商品推荐中使用，Printerst应用于为他们的家庭饲养服务提供个性化定制，而Instagram应用于他们的搜索引擎。

为什么CNN比普通的神经网络效果更好呢？

2. 卷积神经网络的结构

2.1 卷积

卷积是指向图像应用滤波器（Kernel）的过程，通过在原始图像上平移来提取特征。
CNN 卷积神经网络
以图片处理为例子，卷积使得神经网络不再仅对一个像素点处理，而是对一小块儿区域进行处理。这种做法，使得神经网络可以看到图形，而不是某一个点，从而加深了对图片的理解。

在卷积神经网络中，一个卷积层可以有多个不同的卷积核（也可以说是滤波器），而每个卷积核在输入图像上滑动且每次只处理一小块图像。这样输入端的卷积层可以提取到图像中最基础的特征，比如不同方向的直线或者拐角；接着再组合成高阶特征，比如三角形、正方形等；再继续抽象组合，得到眼睛、鼻子和嘴等五官；最后再将五官组合成一张脸，完成匹配识别。即每个卷积层提取的特征，在后面的层中都会抽象组合成更高阶的特征。

卷积层有两个特点：局部连接（Local Connection）和权值共享（Weight Sharing）。局部连接：每个神经元只与上一层的一个局部区域连接，该连接的空间大小叫做神经元的感受野（receptive field）。权值共享：当前层在深度方向上每个channel的神经元都使用同样的权重和偏差。局部连接和权值共享降低了参数量，使训练复杂度大大下降，并减轻了过拟合。同时权值共享还赋予了卷积网络对平移的容忍性。