Single Bounding Box Regression

这篇博客探讨了单个边界框回归(Single box regression)的概念,特别是在RCNN系列算法中的应用。输入包括原始图像或特征图,以及ground truth bounding box。输出是一个数值向量,用于确定图片中的一个边界框。文章主要关注了L2 Loss和Smooth L1 Loss两种损失函数,后者在预测值与目标值差距较大时,通过限制梯度以提高模型的稳健性。
摘要由CSDN通过智能技术生成

输入输出

Bounding Box Regressor 训练过程的输入由两部分组成:

  • data:原图或其feature
  • label: ground truth bounding box.

regression输出为一组可以确定 n 个bounding box的数值. 数值涵义由label决定.
本文讨论 n=1 的情况, 即Single box regression: 一张图片回归一个bounding box.

典型的应用出现在RCNN: Proposal太大时, 需要缩小范围以更精确的框出目标物体. 它的regressor的输入为一个proposal region, 输出为一个bounding box.

一个region由一个四维向量表示: P=(Px,Py,W,H) , 其中, (Px,Py) 为中心点的位置(RCNN)或左上角的位置(Fast RCNN), (W,H) 为它的宽和高. 它对应的bbox ground truth由 G=(Gx,Gy,Gw,Gh) 表示, 各参数的涵义与 P 类似.

L2 Loss

f(P) 表示regressor的输出, 最简单粗暴的loss可以表示为:

L=(f(P)G)2

其中, 代表
  • 8
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值