ResNeXt 论文笔记

最新推荐文章于 2023-11-17 10:46:30 发布

Tianchao龙虾

最新推荐文章于 2023-11-17 10:46:30 发布

阅读量355

点赞数

分类专栏：网络Backbone 文章标签：深度学习神经网络人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wuchaohuo724/article/details/120159412

版权

网络Backbone 专栏收录该内容

15 篇文章

订阅专栏

ResNeXt是针对ResNet的改进，通过引入cardinality（分组数）的概念，将原来的残差块改造成多个并行的路径。研究发现，增加cardinality比增加深度或宽度更能有效提高网络精度，同时保持较低的参数量。ResNeXt通过使用分组卷积，创建了一种简单的结构，即并行堆叠相同拓扑的块，从而在不显著增加参数量的情况下提升了ResNet的性能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Aggregated Residual Transformations for Deep Neural Networks

ResNeXt

论文链接: https://arxiv.org/abs/1611.05431

一、 Problem Statement

Inception模型提出了split-transform-merge的一个策略，但总体而言，如何使初始架构适应新的数据集/任务尚不清楚，特别是当有许多因素和超参数需要设计的时候。

二、 Direction

设计一个简单的结构，融合了VGG/ResNets的重复网络层的策略和Inception模型的split-transform-merge的策略。

三、 Method

先来看一下结构:

由上面的图片可以看出，对ResNet的residual layer进行了改造，变成了32个相同的path。这里提出了一个概念: cardinality。这个有区别于网络的深度，宽度。作者发现，增加这个cardinality比增加网络的深度和宽度更加有效地提升网络的精度，且参数量没有很大的提升。比如，左边的原始ResNet网络，参数量为:
$256\cdot 64 + 3 \cdot 3 \cdot 64 \cdot 64 + 64 \cdot 256 \approx70K$
而改进后的ResNeXt参数量为:
$\cdot (256 \cdot d + 3 \cdot 3 \cdot d \cdot d + d \cdot 256)$
这里的 $C$ 就是cardinality， $d$ 是所对应的width。这里默认取 $C = 32, d = 4$ 。

与ResNet的对比如下:

四、 Conclusion

ResNeXt结构较为简单，利用分组卷积，构建一种平行堆叠相同拓扑结构的block，提升了ResNet的精度的同时，不明显增加参数量。

Reference

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。