ResNeXt详解
论文《Aggregated Residual Transformations for Deep Neural Networks》
1 主要思想
随着CNN网络的发展,很多SOTA的网络结构被提出,同时引入了一些新的结构设计方法。
VGG网络作为一个经典模型,它提出了叠加相同形状的块(stacking block)来增加模型深度的策略,后续提出的深层CNN模型也基本使用了这一策略。
Inception系列网络提出了split-transform-merge的策略,通过多分支卷积实现在低计算开销的前提下去接近大型密集层的表达能力。
文章结合了stacking block和split-transform-merge的策略,在ResNet的基础上提出了ResNeXt网络架构。
2 模型结构
2.1 split-transform-merge
重新回顾一下感知机模型,以便于理解split-transform-merge策略。
输入向量为X,感知机模型的运算逻辑可分为:
- Splitting,X分解为多个低维向量Xi;
- Transforming&