论文地址:https://arxiv.org/abs/1611.05431(2017CVPR)
论文代码:https://github.com/facebookresearch/ResNeXt
定义:
ResNeXt采用了VGG/ResNets的重复层策略,同时以一种简单、可扩展的方式利用分裂-转换-合并策略,是一个用于图像分类的简单、高度模块化的网络结构。
ResNet和ResNeXt模块结构图:
ResNeXt聚合变换公式:
ResNeXt的等效构造块:
深度为2的ResNeXt模块及其等效模块构造:
ResNeXt采用了VGG/ResNets的高度模块化设计。由一堆残差块组成。这些块具有相同的拓扑结构,并遵从由VGG /和ResNets:启发的两条简单的规则:(1)如果产生相同大小的空间图,模块之间共享相同的超参数(宽度和过滤器的大小);(2)每次当空间图下采样模块的宽度就乘2倍。第二条规则是为了确保所有块在FLOPs(floating-point operations, in # of multiply-adds)方面的计算复杂性大致相同。
ResNet和ResNeXt整体框架图:
PS:什么是flops?
FLOPS:注意全大写,是floating point operations per second的缩写,意指每秒浮点运算次数,理解为计算速度。是一个衡量硬件性能的指标。
FLOPs:注意s小写,是floating point operations的缩写(s表复数),意指浮点运算数,理解为计算量。可以用来衡量算法/模型的复杂度
出自:https://zhuanlan.zhihu.com/p/137719986