论文阅读理解 - ResNeXt - Aggregated Residual Transformations for DNN

最新推荐文章于 2024-08-17 20:13:54 发布

AIHGF

最新推荐文章于 2024-08-17 20:13:54 发布

阅读量9.8k

点赞数 9

分类专栏：论文阅读 Torch 图像分类文章标签： ResNeXt ResNet

本文链接：https://blog.csdn.net/zziahgf/article/details/78854456

版权

ResNeXt是一种基于深度神经网络的图像分类技术，通过聚合变换集合来减少参数数量，提升模型性能。与ResNet相比，ResNeXt在保持相似精度的同时，计算效率更高，参数更少。它结合了ResNets的堆叠模块化设计和Inceptions的split-transform-merge策略，引入Cardinality维度，作为网络结构的第三个关键因素。实验表明，增加Cardinality比增加网络深度或宽度更能有效地提高图像分类的准确性。

摘要由CSDN通过智能技术生成

ResNeXt - Aggregated Residual Transformations for Deep Neural Networks

摘要：

高度模块化的网络结构，用于图像分类；

通过重复 build block 来构建网络，每个 build block 聚合了具有相同拓扑结构的变换集；

ResNeXt中，同类、multi-branch 结构的设计具有更少的参数. 引入了新的维度，即 Cardinality(涉及的变换集的尺寸)，作为网络 depth 和 width 维度之外的一种必要因子.

特点：

基于 ImageNet-1K 数据集，实验结果表明，在严格保证计算复杂度时，增加 Cardinality 能够提高图像分类精度；且，增加 Cardinality 比加深或者加宽网络结构更有效.

与 ResNet 相比，相同的精度， ResNeXt 计算量更少，参数更少. ResNeXt-50 接近 ResNet-101 的准确度.

ResNeXt 网络模块化设计更合理，结构更简单，超参数量更少.

VGG-nets/ResNets：堆叠相同形状的网络 building blocks；—— 网络 depth

Inceptions：split-transform-merge，将输入采用( $1×1$ Conv)分裂为几个低维 embedding，再经过一系列特定 filters (如 $3×3$ ， $5×5$ )的变换，最后连接在一起.