目录
1、应用领域
卷积神经网络为图像而生,但应用不限于图像。在图像处理任务上,卷积神经网络可以用来识别位移、缩放及物体形态扭曲的二维图形。一方面,由于其网络模型中的特征是通过训练数据集进行图像特征学习,从而避免了显式地特征抽取;另一方面,由于图像上同一特征映射面上的神经元权值相同,所以卷积神经网络模型可以并行训练,极大地提高神经网络的训练时长。此外,与神经元彼此相连的神经网络(如传统的人工神经网络)相比,卷积神经网络模型的组织方式特殊,其结构模型更易于理解和分析。
(1) 图像分类与识别
(2) 自然语言处理(NLP)
(3) 图像着色
2、卷积的特征值计算方法
3、步长&填充 大小 与输入输出大小的关系
卷积核的Size代表感受野的大小,卷积核的步长度代表提取的精度
步长(stride)就是卷积核在你原图上每一步移动的距离。
步长小,提取的特征会更全面,不会遗漏太多信息。但同时可能造成计算量增大,甚至过拟合等问题。
步长大,计算量会下降,但很有可能错失一些有用的特征。
步长选多少没有一套明确的标准,还是要看你输入图像的大小和卷积核的大小。
总之在计算资源够用的前提下,最好不要让你卷积核错失太多特征。
4、池化层的作用
在卷积神经网络中常常会在相邻的卷积层中间加入池化层,池化层可以有效缩小参数矩阵的尺寸,从而减少参数数量,所以加入池化层可以加快计算速度和防止过拟合。
列举一下的话可以有:
完成下采样
去除冗余信息,对特征进行压缩,降低网络复杂度
实现非线性
扩大感受野
池化一般有最大池化和平均池化,最大池化适用于过滤掉比较多无用信息的场景,比如网络浅层通常会比较多无用信息;而平均池化适用于整体都是有用信息时取一个平均,比如网络深层一般都是重要信息。
在 PyTorch 中还有一个自适应池化(既有最大也有平均),可以方便控制输出特征图的尺寸。
5、整体网络架构
相关资料原文
池化层 原文链接:https://blog.csdn.net/Kester_/article/details/119812588