摘要:
大规模图像分类一直是计算机视觉领域中研究的重点,是实现通用智能的关键.面对海量的图像数据,传统的基于特征工程的分类方法已显得无能为力.随着深度学习特别是卷积神经网络的兴起,图像分类性能得到了极大的提升.目前,卷积神经网络普遍面临着计算消耗大,梯度易消失,分类效率不高等问题,致使模型无法得到进一步应用推广.针对上述问题,本文从集成的角度提出了三种改进的卷积神经网络模型,分别如下: 第一,针对大多数模型对输入图像的特征尺度缺少鲁棒性,导致网络需要较多的层数和参数量的问题,提出了权重共享多级多尺度集成卷积神经网络.首先,训练样本经多次池化后输入权重共享的多级网络,以此提取多尺度输入的特征;然后,在每个层级内部,通过多层多尺度卷积提取同一输入的多尺度特征;最后,将两种特征进行融合,并迭代优化网络参数,实现网络对输入图像的高效特征提取和学习. 第二,针对梯度消失导致深度网络无法得到充分训练,且单纯加深网络对性能提升比较有限的问题,提出了多路径集成卷积神经网络.首先,通过捷径连接将网络的浅层和深层输出特征直接拼接构成多路径集成结构,避免梯度消失的同时融合多层特征,实现深度网络的构建;然后,在多路径集成的基础上成倍增加网络的特征通道数,并引入改进的通道注意力等模块,使得特征提取更为充分高效;最后,迭代优化网络参数,完成图像分类任务. 第三,针对网络结构和卷积计算中存在大量冗余,导致网络具有较大的计算量和参数量的问题,提出了多尺度多路径集成卷积神经网络.首先,在多路径集成的基础上,利用多尺度低秩卷积替换高秩卷积,降低网络计算复杂度的同时提取多样特征;其次,引入卷积核稀疏连接机制,迫使卷积输出相关性降低,去除特征冗余并压缩网络;然后,通过线性稀疏瓶颈结构对输入通道进行线性加权,一方面缩减通道数量,另一方面将不同尺度特征分别融合,并且最大程度保留输入信息;最后,迭代优化网络参数,实现网络轻型化. 在CIFAR,tiny ImageNet等图像数据集上的实验结果表明,所提卷积神经网络模型取得了较高的分类精度和网络性能.
展开