DETR论文解读

最新推荐文章于 2024-07-21 09:53:28 发布

harry_tea

最新推荐文章于 2024-07-21 09:53:28 发布

阅读量317

点赞数

分类专栏： PaperReading 文章标签：深度学习计算机视觉目标检测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41978699/article/details/129568437

版权

PaperReading 专栏收录该内容

11 篇文章 2 订阅

订阅专栏

DETR基本介绍

DETR的一个创新是端到端的目标检测，它能够将目标检测看做成集合预测问题，而不需要像之前的目标检测算法需要anchor或者nms等，总之就是一个将CNN和transformer结合的一个新颖的目标检测框架，改变预测头还可以进行分割等任务

算法框架

DETR的整体架构如下所示，要检测的图片首先通过CNN提取特征，根据原文这里是提取的ResNet最后一层特征，然后将特征通过Transformer的Encoder与Decoder，这里的encoder与decoder有点类似attention is all you need论文中的编解码器，但是有区别的是这里的decoder处加了100个object queries，这也是本文最关键的部分吧。随后这100 query来搜索图中的目标并进行分类（分别有一个bbox head和cls head），最后通过匈牙利算法进行匹配GT的bbox和相应的类别计算loss

更加具体的框架图如下所示

匈牙利匹配细节

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
DETR论文解读

DETR的一个创新是端到端的目标检测，它能够将目标检测看做成集合预测问题，而不需要像之前的目标检测算法需要anchor或者nms等，总之就是一个将CNN和transformer结合的一个新颖的目标检测框架，改变预测头还可以进行分割等任务。
复制链接

扫一扫

专栏目录

harry_tea CSDN认证博客专家 CSDN认证企业博客

码龄6年

172: 原创

2万+: 周排名

52万+: 总排名

54万+: 访问

: 等级

2537: 积分

2642: 粉丝

597: 获赞

114: 评论

2090: 收藏

私信

关注

分类专栏

PaperReading 11篇
Python 15篇
Linux 17篇
ImageProcess 11篇
torch.nn 3篇
PyTorch 50篇
utils 16篇
torch.operator 3篇
可视化 6篇
nn.functional 4篇
torchvision 1篇
Statistic 7篇
blog 6篇
Numpy 6篇

最新评论

nn.LayerNorm的实现及原理
xxyh1993: 画错了
pydensecrf安装
weixin_44997897: 第四个方法可用
Pytorch并行计算(二): DistributedDataParallel介绍
Burger~: dist.barrier() 有点误导人了吧，学过OS的都知道：你等我我等你大家都在等不就卡死了吗
大气散射模型
v特别v的406186: 请问体积微元怎么推导的啊
nn.BatchNorm1d
weixin_46441075: 讲的什么鬼，漏洞一大堆

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。