卷积神经网络(CNN)在图像处理方面有很多出色的表现,在ImageNet上有很多成功的模型都是基于CNN的。AlexNet是具有历史意义的一个网络,2012年提出来当年获得了当年的ImageNet LSVRC比赛的冠军,此后ImageNet LSVRC的冠军都是都是用CNN做的,并且层数越来越深。可以说AlexNet的提出是具有里程碑式的意义的,它使得CNN成为图像识别分类领域的核心算法,引来了深度学习的大爆发。
另一个有名的CNN模型是2015年何凯明团队提出来的深度残差网络ResNet,他引入了残差模块,一定程度改善了网络的退化现象,为网络加深一定程度后网络分类精度随着深度加深反而降低的现象提供了解决思路。
1.AlexNet
AlexNet主要特点:
- 修正线性单元:ReLU。ReLU函数的导数始终为1,使得计算量大大减小,收敛速度比sigmoid,tanh快很多。
- 防止过拟合方法:Dropout:通过定义的概率将神经元置为0,这个神经元如同被删除;
数据扩充:当训练数据有限时,将训练数据变换进行扩充(eg.水平翻转、裁剪、颜色、光照) - 重叠池化:一种避免过拟合的手段
- 增加局部响应归一化层 (LRN):有助于增加泛化能力
2.ResNet
ResNet最显著的特征就是引入了残差模块。