主结构
卷积层
特征图: 二维卷积层输出的二维数组可以看作是输入在空间维度(宽和高)上某一级的表征。
感受野: 是指神经网络中某一层输出的特征图上的像素点对应到输入图像上的区域大小。换句话说,它表示了一个特定层输出上的单个元素对输入数据的影响范围。
填充: 是指在输入高和宽的两侧填充元素(通常是0元素)
步幅: 每次滑动的行数和列数称为步幅(stride),默认在高和宽两个方向上步幅均为1。
单通道卷积,多通道卷积:https://zhuanlan.zhihu.com/p/634882615
卷积层参数:
- 卷积核大小(Kernel Size):卷积核的大小定义了卷积的感受野。
- 卷积核步长(Stride):定义了卷积核在卷积过程中的步长。
- 填充方式(Padding):在卷积核尺寸不能完美匹配输入的图像矩阵时需要进行一定的填充策略。
- 输入通道数(In Channels): 指定卷积操作时卷积核的深度。
- 输出通道(Out Channels):指定卷积核的个数。
1x1卷积层
1x1卷积层的作用:
- 降维,减少网络参数量(其实例如:3x3可以做到,但是3x3的参数量是很大的)。
- 实现信息的跨通道交互和整合。