ResNeXt创新点解析

最新推荐文章于 2024-07-10 23:15:45 发布

胖虎记录学习

最新推荐文章于 2024-07-10 23:15:45 发布

阅读量685

点赞数

分类专栏：目标分类网络文章标签： cnn 神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/panghuzhenbang/article/details/124471709

版权

目标分类网络专栏收录该内容

35 篇文章 10 订阅

订阅专栏

《Aggregated Residual Transformations for Deep Neural Networks》

1.亮点：

利用分组卷积，构建一种平行堆叠相同拓扑结构的block；

在不明显增加参数的情况下提升了准确率，结构简单，具有更好的通用性。

之前的网络模型存在的问题

传统的要提高模型的准确率，都是加深或加宽网络，但是随着超参数数量的增加（比如channels数，filter size等等），网络设计的难度和计算开销也会增加。
类似 Inception 系列的网络又存在人为对网络超参数设定的针对性比较强，当应用在别的数据集上时需要修改许多参数，因此可扩展性一般。

2.网络结构：

这里写图片描述分支的个数就是 cardinality，例如右图分32组卷积，每组4个进行卷积。此处借鉴了 GoogLeNet 的 split-transform-merge，和 VGG/ResNets 的 repeat layer。split-transform-merge 是指通过在大卷积核层两侧加入 1x1 的网络层，控制核个数，减少参数个数的方式；而 repeat layer 则是指重复相同的几层，前提条件是这几层的输出输出具有相同的维度，一般在不同的 repeat layers 之间使用 strip=2 降维，同时核函数的个数乘 2。

网络参数

这里写图片描述

网络模型形式：在数学上完全等价

这里写图片描述

3.分组卷积

普通卷积：

（图片来自网络，侵删）

在这里插入图片描述

输出数据为：输入feature map尺寸：W × H × C ，分别对应feature map的宽，高，通道数；
单个卷积核尺寸：k × k × C ，分别对应单个卷积核的宽，高，通道数；输出feature map尺寸：W ′ × H ′×N(卷积核个数，这里假设为1）

分组卷积：（图片来自网络，侵删）

在这里插入图片描述

输入每组feature map尺寸：W × H × $\frac{C1}{g}$ ，共有g组；单个卷积核每组的尺寸：k × k × $\frac{C2}{g}$ ，卷积核被分成了g组；输出feature map尺寸：W' × H' × g ，共生成g个feature map。

（图片来自网络，侵删）

在这里插入图片描述

普通卷积参数量k×k×C1 × C2
分组卷积参数量k×k×C1/g×C2/g×g (参数量减少为原来的1/g)

4.创新点

作者基于Iception与ResNet提出了一种平行堆叠且相同拓扑结构的blocks，在不明显增加参数量的情况下提升了模型的准确率，同时相同的拓扑结构使网络超参数减少，便于模型进行移植。

仅为学习记录。侵删！

胖虎记录学习

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

胖虎记录学习 CSDN认证博客专家 CSDN认证企业博客

码龄5年

58: 原创

7万+: 周排名

181万+: 总排名

19万+: 访问

: 等级

901: 积分

59: 粉丝

252: 获赞

65: 评论

1742: 收藏

私信

关注

热门文章

分类专栏

最新评论

可变形卷积(Deformable Conv)原理解析与torch代码实现
Pixelikes: 作者你这把左下坐标和右上坐标写反了： q_lb = torch.cat([q_lt[..., :N], q_rb[..., N:]], dim=-1) q_rt = torch.cat([q_rb[..., :N], q_lt[..., N:]], dim=-1) 但是你算系数的时候也写反了： g_lb = (1 + (q_lb[..., :N].type_as(p) - p[..., :N])) * (1 - (q_lb[..., N:].type_as(p) - p[..., N:])) g_rt = (1 - (q_rt[..., :N].type_as(p) - p[..., :N])) * (1 + (q_rt[..., N:].type_as(p) - p[..., N:])) 所以歪打正着结果没问题
可变形卷积(Deformable Conv)原理解析与torch代码实现
OZH?: 我也存在这个问题，请问解决了吗
可变形卷积(Deformable Conv)原理解析与torch代码实现
m0_70923469: RuntimeError: CUDA error: device-side assert triggered CUDA kernel errors might be asynchronously reported at some other API call, so the stacktrace below might be incorrect. For debugging consider passing CUDA_LAUNCH_BLOCKING=1. Compile with `TORCH_USE_CUDA_DSA` to enable device-side assertions. 这是咋回事
可变形卷积(Deformable Conv)原理解析与torch代码实现
ping5h: 感觉逻辑图里的张量大小有问题，比如双线性插值之后的最后一维的大小N，代码里的N其实大小是3x3，最后一步卷积之前的维度应该是（B，inC，Hx3，Wx3）
可变形卷积(Deformable Conv)原理解析与torch代码实现
yyl10110215: 在最开始的公式讲解上，应该是对于输出特征图上的任意一点，

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

胖虎记录学习 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。