【深度学习】如何通俗理解图像识别CNN中的卷积与池化？

最新推荐文章于 2024-05-29 18:20:51 发布

如风_Antoni

最新推荐文章于 2024-05-29 18:20:51 发布

阅读量1w

点赞数 3

分类专栏：自学常用基础知识机器学习与深度学习文章标签：卷积图像识别深度学习计算机视觉 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_17731207/article/details/109551192

版权

自学同时被 3 个专栏收录

13 篇文章 13 订阅

订阅专栏

常用基础知识

12 篇文章 4 订阅

订阅专栏

机器学习与深度学习

3 篇文章 1 订阅

订阅专栏

一、卷积

1.为什么要引入卷积层？

因为全连接层输入图像时，会将图像的3维数据拉平为1维数据，而图像是3维形状，这个形状中可能包含重要的空间信息。比如，空间上邻近的像素为相似的值、RGB的各个通道之间分别有密切的关联性、相距较远的像素之间没有什么关联等，所以使用全连接层可能会忽略掉一些空间信息，进而造出最后的预测结果不准确。
卷积层则可以保持形状不变。当输入数据是图像时，卷积层会以3维数据的形式接收输入数据，并同样以3维数据的形式输出至下一层。

2.卷积层的功能
卷积层的功能是提取图像的底层特征。
3.卷积的过程
静态图在这里插入图片描述
动态图

对于输入的图像，卷积层按3维数据形式存放，输入数据与卷积核对应位置相乘再相加，从上到下从左到右滑动，得到Feature Map(特征映射或特征图)。
4.补充知识
填充（Padding）:在进行卷积层的处理之前，有时要向输入数据的周围填入固定的数据（一般为0）。
填充的好处：

防止边缘的特征被忽略
可以调整输出大小

感受野：CNN中的感受野与生物学上的感受野不同，生物学上的感受野指的是听觉、视觉等神经系统中一些神经元的特性，即神经元只接受其所支配的刺激区域内的信号；CNN中的感受野通常指卷积核划过的区域。

二、池化

1.池化的功能
池化层的功能是防止过拟合，减小数据维度，为CNN带来平移不变性。
2.池化的方式
（1）最大池化
在这里插入图片描述
（2）平均池化

3.卷积神经网络的结构

在这里插入图片描述
与传统的神经网络相比，卷积神经网络（CNN）多了两个层，即卷积层（Convolutional Layer）和池化层（Pooling Layer）。
各层的功能如下：

卷积层：提取图像的底层特征。
池化层：防止过拟合，减小数据维度，为CNN带来平移不变性。
全连接层：汇总之前卷积层和池化层最终得到的图像信息，可以通过两种方式输出，得到最后的预测结果。一是用softmax函数,一般用于多分类问题，最终呈现形式是各个可能性的概率大小，二是用sigmoid函数，输出分类结果，一般用于二分类问题。

关注

3
点赞
踩
9

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。