学习目标:卷积层的基本内容
1.里的多输入和多输出通道
2.池化层
学习内容:
通道数
一、多个输入通道
彩色图像有RGB三个通道,转化为灰度会丢失信息。每个通道都有一个自己的卷积核,结果是所有通道卷积结果的和,所以输出是一个单通道。
作用:输入通道核识别一些纹理、小的局部并根据特点组合输入中的模式,给下一个输入,慢慢的组合,并夸大自己识别的局部。
二、多个输出通道
对自己的输出通道都有一个自己的三维的卷积核,每个核生成一个输出通道,就形成了多个通道的输出。
作用:每个输出通道可以识别特定模式。
三、1*1卷积核
Kn=Kw=1是一个受欢迎的选择,它不识别空间信息,只是融合不同通道的信息,相当于一个全连接层,不考虑空间信息,只考虑通道的融合。
池化层
池化层的背景:由于积对位置太敏感(例如检测垂直边缘),需要一定的平移不变性。
- 二维最大池化:不再做点积了,而是返回窗口中的最大值,以解决一定位置敏感,有一点的模糊化的效果。
- 池化层与卷积层类似,都有填充和步幅。
- 没有可学习的参数
- 在每个输入通道应用池化层以获得相应的输出通道。(不融合其他通道)
- 输入=输出,注意和卷积的不同。
- 最大池化层:每个窗口最强的模式信号。
- 平均池化层:将最大池化层中“最大”操作替换为“平均”。
学习时间:
- 周一晚上9点
总结
1.输出的通道数是卷积层的超参数,输入不是,
2.每个输入通道有独立的二维卷积核,所有通道结果相加得到一个输出通道结果。
3.每个输出通道有独立的三维卷积核。
4.池化层返回窗口中的最大值或者平均值。
5.池化层主要是缓解卷积层对位置的敏感性。
6.池化层同样有窗口大小、填充和步幅作为超参数。