什么是特征
传统的图像处理或是计算机视觉中的图像特征主要包括颜色特征、边缘特征、形状特征、纹理特征等。颜色特征主要有颜色直方图算法,边缘特征主要有sobel、canny等算法,形状特征主要是特征点(sift)、HOG特征、Haar特征等,纹理特征主要有LBP、灰度共生矩阵等。那深度学习的特征主要包括什么呢?
深度学习中的学习实际上就是对“特征”的学习,权重是对特征的有效表达。而深度学习的特征主要是在黑盒子中进行,当然我们可以有可视化的过程。深度学习的尤其是卷积神经网络主要特征大体可以分为三部分:通道内特征、通道间特征以及通道信息融合。
通道内特征
通道内特征其实通俗一些就是在本通道内进行特征的提取。例如灰度图像的高斯滤波、双边滤波、中值滤波、sobel算子、LOG算子、Prewitt算子等等,这些知识学过计算机视觉的同学都应该很容易理解。通道内特征其实就是单通道特征内提取图像图像的特征。
通道间特征
通道间特征其实就是在多个通道内进行特征的提取。例如彩色图像喊有三个通道,即R/G/B三个通道,我们可以通过合理地公式将这三个通道地数据统一到一个通道中,即彩色转灰度。这个也比较好理解。
通道信息融合
通道信息融合实际上就包含了通道内特征和通道间特征。举一个简单的例子:我们在进行一阶导的边缘提取时,往往会先计算X方向与Y方向的梯度特征,然后再通过算术平方根或是算术绝对值等方法将X与Y方向的特征进行融合得到新的特征map,这个过程就是特征融合的过程。
以上只是利用传统方法对深度学习算法的特征提取进行必要的对比讲解。但是,深度学习的通道数量能达到几百甚至上千,在网络前向传播过程中通道间特征提取与通道间的特征提取几乎是同时进行的(比如利用333的卷积核),当然,其中也包括了二者的融合过程。