- 卷积过程是在图像每个位置进行线性变换映射成新值的过程,可以将卷积核看作权重,拉成向量记作 w w w ,图像对应位置的像素拉成向量记作 x x x ,那么卷积结果就为 y = w x + b y=w^{} x+b y=wx+b ,即向量内积+偏置b
- 可以理解为多层卷积是在进行逐层映射,整体构成一个复杂函数,训练过程是在学习每个局部映射所需要的权重,训练过程可以 看成是函数拟合的过程。
- 通过多层卷积,将简单模式组合成复杂模式,这种灵活的组合能保证具有足够的表达能力和泛化能力。
多层卷积抽取复杂特征:
- 每层得到的特征图直接观察室看不出什么的,因为其中每个位置都代表了某种模式,需要在这个位置将模式复现出来才能形成人能够理解的图像。
- 卷积神经网络每层的卷积核权重是由数据驱动学习得来,不是人工设计,
- **数据驱动卷积神经网络逐层学到由简单到复杂的特征,复杂模式是由简单模式组合而成。**例如layer4的狗脸是由layer3的几何图形组合而成,layer3的几何图形是由layer2的纹理组合而成,layer2的纹理是由layer1的边缘组合而成,从特征图上看,layer4特征图上一个点代表layer3某种几何图形或者表面的组合,layer3特征图上一个点代表layer2某种纹理的组合,layer2特征图上一个点代表layer1某种边缘的组合。
- 不同的边缘 -> 不同纹理 -> 不同几何图形和表面 -> 不同的狗脸、不同的物体。前面层模式的组合可以多种多样,使后面层可以描述的模式也可以多种多样,所以具有很强的表达能力,泛化能力更强。