文章目录
1、卷积为什么可以提取特征
解释一:函数逼近论:
cnn就是一个万能的拟合函数,可以逼近理论上足够复杂的任意分布。所以自然能找到有效表示数据训练集分布的特征。
解释二:信号与系统:
卷积很多时候出现在一个系统的单位脉冲响应与输入信号上,用于求出系统在一定输入下所对应的输出。
解释三:线性代数的几何意义:
1)“矩阵乘法对应了一个变换,是把任意一个向量变成另一个方向或长度都大多不同的新向量。在这个变换的过程中,原向量主要发生旋转、伸缩的变化。如果矩阵对某一个向量或某些向星只发生伸缩变换,不对这些向量产生旋转的效果,那么这些向量就称为这个矩阵的特征向量,伸缩的比例就是特征值。”
简单而言,对于一个输入,只需要提取合适的主要特征,就能得到有效的判断。例如对人的判断:只需要判断头发的长短、衣服的着装等特征就可得知一个人的性别。
2)因此,卷积核
≈
υ
(
特
征
向
量
)
\approx\upsilon(特征向量)
≈υ(特征向量),反向传播≈求解特征向量集,我们的图片≈矩阵A,注意,这些概念不是等价的,只是用易懂的方式去解释这些原理。
解释四:线性代数的投影意义:
1)因为卷积本质是一个向量乘法,求原始图像的特征在卷积这个向量上的投影
2)就是向量点乘的物理意义
3)那和卷积夹角越小
4)越相似的特征保留的越多
5)就实现了特征的筛选
2、1*1卷积的作用
3、其他的一些卷积
3.1 可变形卷积(DCN)
1)解决的问题:正常的卷积核感受野都是正方形。可以有效感受野都是正方形吗?显然不是。
2)怎么解决:卷积核不变,被卷积的感受野可变形。比如3*3的感受野9个像素点,可以在以中心像素点周边任意的deltax,deltay。计算一个offset即可
3)技术难点:怎么计算offset?学习出来。被感受野区域是以中心像素点为基准,向任意方向偏移。这个任意方向,用一个offset层学习出来。
4)优缺点:效果更好,支持了任意形状。缺点是增加了计算量。可以用分组思想降低计算量。