Conditional-DETR 论文解析

最新推荐文章于 2024-05-30 17:49:51 发布

从现在开始壹并超

最新推荐文章于 2024-05-30 17:49:51 发布

阅读量1.2k

点赞数 4

分类专栏：计算机视觉网络模型-图像分类&目标检测文章标签：深度学习 pytorch 人工智能卷积神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_45971439/article/details/120349063

版权

计算机视觉网络模型-图像分类&目标检测专栏收录该内容

10 篇文章 40 订阅 ¥39.90 ¥99.00

订阅专栏

超级会员免费看

论文地址：https://arxiv.org/abs/2108.06152
源码地址：https://github.com/Atten4Vis/ConditionalDETR

Conditional DETR for Fast Training Convergence

1. Abstract
2. Introduction & Related Work
3. Method
4. Experiments

1. Abstract

原始的DETR采用Transformer中的Encoder和Decoder结构进行目标检测，获得了可观的结果。在这篇论文中，为了解决DETR的训练速度慢的问题，引入一个conditional cross-attention机制来实现更快的DETR训练。原始的DETR中的coss-ateention module中方极大的依赖于content embeddings来实现4个角点的预测，增加对高质量的content embeddings的需求，并且每个object query的co-attended visual regions可能与查询需要预测的边界框无关。因此，从decoder embeddings中学习一个conditional spatial query，每个cross-head都能够关注一个包含不同区域的visual regions。不需要再浪费太多时间去寻找合适的attnetion regions，加快DETR的训练。实验结果表明，在使用Res-50/101为为backbone时，Conditional DETR相比DETR训练速度快6.7倍；而对于使用DC5-R50/101，会快10倍。

2. Introduction & Related Work

这个部分我只挑主要的来说明，关于相关工作，说来说去都是那些东西，就不过多去提及了。

对比两种DETR的

了解本专栏

超级会员免费看

从现在开始壹并超

关注

4
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
Conditional-DETR 论文解析

论文地址：Conditional-DETR论文源码地址：Conditional-DETR-torchConditional DETR for Fast Training Convergence1. Abstract2. Introduction & Related Work3. Method3.1. Overview3.2. Decoder Cross-Attention3.3. Architecture4. Experiments1. Abstract原始的DETR采用Transforme
复制链接

扫一扫

专栏目录

从现在开始壹并超 CSDN认证博客专家 CSDN认证企业博客

码龄5年

60: 原创

7万+: 周排名

31万+: 总排名

9万+: 访问

: 等级

854: 积分

857: 粉丝

161: 获赞

119: 评论

414: 收藏

私信

关注

热门文章

分类专栏

最新评论

Linux上搭建ElasticSearch-8.x集群以及安装Kibana（保姆级安装教程）
m0_45896506: 老哥我按照你这个进行设置，说我是单节点集群，你有遇到这个问题吗
Conformer论文以及代码解析(下)
从现在开始壹并超: 卷积层权重维度不匹配吧，权重要求是4-d的，你的输入是3-d的，你扩充一个维度再试试
Conformer论文以及代码解析(下)
weixin_49138334: 你好我想问一下，为什么那个conformer我的总报这个错 RuntimeError: Expected 4-dimensional input for 4-dimensional weight [64, 3, 7, 7], but got 3-dimensional input of size [3, 224, 224] instead 我用的是花分类的数据集，改好尺寸后，现在输出的张量形状都是 ([1, 3, 224, 224])，他说输入给卷积层的张量形状不正确。我应该怎么改呀
Conformer论文以及代码解析(下)
从现在开始壹并超: main.py中-device参数对应的是训练设备类型，默认值是cuda，应该是不支持CPU来训练的。另外，对于Transform模型的训练，由于params和float都比比较大，CPU内存感觉不一定够，还是建议用GPU来训练好一点
Conformer论文以及代码解析(下)
weixin_49138334: 请问这个代码可以用CPU运行吗，需要怎么改

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

从现在开始壹并超 你的鼓励，我们就是hxd

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。