卷积神经网络（CNN）个人理解分享

最新推荐文章于 2024-10-02 00:23:27 发布

Nwiliuyw

最新推荐文章于 2024-10-02 00:23:27 发布

阅读量508

点赞数 7

文章标签： cnn 人工智能神经网络经验分享

本文链接：https://blog.csdn.net/wywzb/article/details/140902279

版权

大家好！今天我们来介绍一下卷积神经网络（CNN），文章内容的顺序与B站唐宇迪老师的深度学习课程保持一致，大家如果觉得我写的不好的话可以去B站听课。好了，话不多说，下面开始进入卷积神经网络的世界！

（文中图片均来源于B站唐宇迪老师课程课件，均只用于个人学习用途）

1.卷积神经网络的应用

第一个是检测任务：

第二个是分类和检索：

第三个是超分辨率重构：

第四个是医学任务等：

第五个是无人驾驶：

第六个是人脸识别：

2.卷积的作用

左边的是传统的神经网络也是最简单的神经网络--多层感知机（MLP），右边的是我们今天要说的卷积神经网络。从图中来看，它们最直观的不同就是维度的不同，左边MLP的输入是一个向量，是二维的，而右边输入的是一个立体的图像（带颜色通道的图像），是三维的，不过我们后面可以知道对于一张像素特别高的图片来说，左边的MLP是显然不行的。我们举个例子，我们有一张可爱的小猫图片：

它的像素是1000*1000*3的，如果我们要输入到左边的MLP中，那它就要被拉平成一个数量级高达10^6级别的向量，哪怕隐藏层只有1000个，最后的参数数量也会高达10^9，这是我们训练AI绝对不能接受的。而卷积神经网络就可以大大缩写参数的数量，具体操作我们后面再说。

我们先简单看一下CNN的整体架构：

其中卷积层的作用简单来说是提取特征，池化层简单来说就是压缩特征。

我们先围绕下面这张图看看卷积到底做了什么事：

从左往右看，我们先将这个32*32*3的图片抠出一部分，大小为5*5*3，由于这个小图片有三个颜色通道，为此我们取出其中一个颜色通道（右边那种大蓝图），图中数字代表该位置的像素值。而卷积便是生成最右边那张绿图（该图层的特征图）的操作，完成这个操作我们肯定不是凭空完成的，我们需要一个卷积核（其实这个不能叫卷积核，卷积核是三维的，这个应该叫卷积核的一个卷积平面），这就是图中那个3*3大小的深蓝色核，每个图层所需的卷积核都不一样，为此我们将每一个图层的卷积核合起来便是一个完整的卷积核。现在看图中深蓝色部分，1*0+3*1+1*2+2*2+2*2+3*0+0*0+2*1+2*2=19，这就是绿色图中19的由来，其他数字大家可以自己推推看，应该是一样的（滑动步长为1）。

3.卷积特征值的计算

我们先来看看图像的颜色通道：