2024年运维最新深度学习之目标检测（十一）--DETR详解

最新推荐文章于 2024-06-14 09:30:00 发布

2401_83947398

最新推荐文章于 2024-06-14 09:30:00 发布

阅读量661

点赞数 5

分类专栏：程序员文章标签：深度学习目标检测人工智能

本文链接：https://blog.csdn.net/2401_83947398/article/details/138371196

版权

程序员专栏收录该内容

128 篇文章 0 订阅

订阅专栏

∈

∑

match

⁡

(

)

match

⁡

(

)

−

{

≠

∅

}

(

)

(

)

{

≠

∅

}

box

(

)

\hat{\sigma}=\underset{\sigma \in \mathfrak{S}_{N}}{\arg \min } \sum_{i}^{N} \mathcal{L}_{\operatorname{match}}\left(y_{i}, \hat{y}_{\sigma(i)}\right) \ \mathcal{L}_{\operatorname{match}}\left(y_{i}, \hat{y}_{\sigma(i)}\right) = -\mathbb{1}_{\left{c_{i} \neq \varnothing\right}} \hat{p}_{\sigma(i)}\left(c_{i}\right)+\mathbb{1}_{\left{c_{i} \neq \varnothing\right}} \mathcal{L}_{\text {box }}\left(b_{i}, \hat{b}_{\sigma(i)}\right)

σ^{=σ∈SNargmini∑NLmatch(yi,y}σ(i))Lmatch(yi,y^{σ(i))=−1{ci=∅}p}σ(i)(ci)+1{ci=∅}Lbox (bi,b^σ(i))
我们来看看 ground truth

y_i

yi 和预测出来的第

(

)

\delta(i)

δ(i) 个结果之间的匹配损失。首先是对于那些不是背景的，获得其对应的预测是目标类别的概率，然后用框损失减去预测类别概率。这也就是说不仅框要近，类别也要基本一致，是最好的。经过匈牙利算法之后，我们就得到了 ground truth 和预测目标框之间的一一对应关系。然后就可以计算损失函数了。

损失函数和匹配损失不同之处在于，损失函数需要是正值，所以使用了 log-probability。对于

c_i = \phi

ci=ϕ 的类别损失，将分类损失除了 10，降低其作用，因为正负样本不均衡。这种思想和 Faster R-CNN 等一致。目标边界框回归损失则是 IOU 损失和 L1 损失的加权和，其中 IOU 损失对于 Scale 不敏感，L1 损失对于 Scale 敏感。事实上 DETR 用的是 GIoU 损失。

Hungarian

(

)

∑

[

−

log

⁡

(

)

(

)

{

≠

∅

}

box

(

)

]

box

(

)

iou

(

)

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化的资料的朋友，可以点击这里获取！

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

2401_83947398

关注

5
点赞
踩
11

收藏

觉得还不错? 一键收藏
2
评论
2024年运维最新深度学习之目标检测（十一）--DETR详解

ci=ϕ 的类别损失，将分类损失除了 10，降低其作用，因为正负样本不均衡。目标边界框回归损失则是 IOU 损失和 L1 损失的加权和，其中 IOU 损失对于 Scale 不敏感，L1 损失对于 Scale 敏感。首先是对于那些不是背景的，获得其对应的预测是目标类别的概率，然后用框损失减去预测类别概率。经过匈牙利算法之后，我们就得到了 ground truth 和预测目标框之间的一一对应关系。损失函数和匹配损失不同之处在于，损失函数需要是正值，所以使用了 log-probability。
复制链接

扫一扫