我读ResNeXt

最新推荐文章于 2025-08-04 22:29:41 发布

原创最新推荐文章于 2025-08-04 22:29:41 发布 · 1.5w 阅读

25 ·

CC 4.0 BY-SA版权

文章标签：

#resnext #深度学习 #机器学习 #rbg

文献阅读笔记专栏收录该内容

18 篇文章

订阅专栏

背景

论文地址：Aggregated Residual Transformations for Deep Neural Networks
代码地址：GitHub
这篇文章在 arxiv 上的时间差不多是今年 cvpr 截稿日，我们就先理解为是投的 cvpr 2017 吧，作者包括熟悉的 rbg 和何凯明，转战 Facebook 之后代码都放在 Facebook 的主页里面了，代码也从 ResNet 时的 caffe 改成了 torch :)

贡献

网络结构简明，模块化
需要手动调节的超参少
与 ResNet 相比，相同的参数个数，结果更好：一个 101 层的 ResNeXt 网络，和 200 层的 ResNet 准确度差不多，但是计算量只有后者的一半

方法

这里写图片描述
提出来 cardinality 的概念，在上图左右有相同的参数个数，其中左边是 ResNet 的一个区块，右边的 ResNeXt 中每个分支一模一样，分支的个数就是 cardinality。此处借鉴了 GoogLeNet 的 split-transform-merge，和 VGG/ResNets 的 repeat layer。
所谓 split-transform-merge 是指通过在大卷积核层两侧加入 1x1 的网络层，控制核个数，减少参数个数的方式。借鉴 fei-fei li 的 cs231n 课件1：
这里写图片描述
而 repeat layer 则是指重复相同的几层，前提条件是这几层的输出输出具有相同的维度，一般在不同的 repeat layers 之间使用 strip=2 降维，同时核函数的个数乘 2。