RT-DETR改进策略【Backbone/主干网络】| ICLR-2023 替换骨干网络为：RevCol 一种新型神经网络设计范式

Limiiiing

已于 2025-03-04 13:38:50 修改

阅读量583

点赞数

CC 4.0 BY-SA版权

分类专栏： RT-DETR改进专栏文章标签：深度学习目标检测 RT-DETR 计算机视觉

于 2024-12-04 09:05:20 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42591591/article/details/144213674

RT-DETR改进专栏专栏收录该内容

该专栏为热销专栏榜第30名

163 篇文章 ¥99.90 ¥299.90

订阅专栏

一、本文介绍

本文记录的是基于RevCol的RT-DETR目标检测改进方法研究。RevCol是一种新型神经网络设计范式，它由多个子网（列）及多级可逆连接构成，正向传播时特征逐渐解缠结且保持信息。可逆变换借鉴可逆神经网络思想，设计多级可逆单元用于解决模型对特征图形状的限制以及与信息瓶颈原则的冲突。本文将其应用到RT-DETR中，并配置了原论文中的revcol_tiny、revcol_small、revcol_base、 revcol_large和revcol_xlarge五种不同大小的模型，以适应不同的需求。

专栏目录：RT-DETR改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进

专栏地址：RT-DETR改进专栏——以发表论文的角度，快速准确的找到有效涨点的创新点！

文章目录

一、本文介绍
二、RevCol模型设计
三、RevCol的实现代码
四、修改步骤
五、yaml模型文件
- 5.1 模型改进⭐
六、成功运行结果

二、RevCol模型设计

2.1出发点

信息瓶颈原则的局限：传统监督学习网络遵循信息瓶颈原则（IB），如图所示，靠近输入的层包含更多低级信息，靠近输出的层富含语义信息，即与目标无关的信息在逐层传播中逐渐被压缩。但这种方式可能导致下游任务性能不佳，尤其当学习到的特征过度压缩或语义信息与目标任务无关，且源任务和目标任务存在领域差距时。

在这里插入图片描述

解缠结特征学习的需求：提出构建网络学习解缠结表示，不同于IB学习，解缠结特征学习旨在将任务相关概念或语义分别嵌入到几个解耦维度，同时保持整个特征向量大致与输入有相同信息量，类似于生物细胞机制。

在计算机视觉任务中，学习解缠结特征是合理的，例如在Imag

了解本专栏

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Limiiiing 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。