bounding box regression讲解

最新推荐文章于 2023-03-23 10:10:08 发布

littletomatodonkey

最新推荐文章于 2023-03-23 10:10:08 发布

阅读量1.2k

点赞数

分类专栏：图像处理深度学习文章标签： bounding box regression RPN

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012526003/article/details/82155937

版权

深度学习同时被 2 个专栏收录

40 篇文章 1 订阅

订阅专栏

10 篇文章 0 订阅

订阅专栏

简介

bbox回归指的是使用变换的方法，将当前预测的bbox进行变换，使其更加接近gt box。
对于一般的bbox，可以由 $x,y,w,h$ 4个变量进行表示，将我们的目标抽象为给定原始的proposal $P$ ，将groundtruth box记为 $G$ ，我们希望能够找到一个变换关系，使得原始框可以映射得到一个更接近gt box的回归窗口 $\hat G$ 。

具体做法

首先进行平移，之后再进行缩放，具体公式如下

G^x = P w d x (P) + P x G^y = P h d y (P) + P y G^w = P w e d w (P) G^h = P h e d h (P)

$\begin{array}{l} {{\hat G}_x} = {P_w}{d_x}(P) + {P_x}\\ {{\hat G}_y} = {P_h}{d_y}(P) + {P_y}\\ {{\hat G}_w} = {P_w}{e^{{d_w}(P)}}\\ {{\hat G}_h} = {P_h}{e^{{d_h}(P)}} \end{array}$

在这里， $(\hat G_x, \hat G_y, \hat G_h, \hat G_h \approx (G_x, G_y, G_h, G_h)$

注意：上面w和h使用指数方式进行变换，是为了防止长度和宽度出现负值的情况。
- 针对以上变换方法，在IOU较大的情况下，可以将这种变换关系假设为线性变换，可以得到以下平移变换和尺度缩放的参数的计算公式

t x = (G x - P x) / P w t y = (G y - P y) / P h t w = log (G w P w) t h = log (G h P h)

$\begin{array}{l} {t_x} = ({G_x} - {P_x})/{P_w}\\ {t_y} = ({G_y} - {P_y})/{P_h}\\ {t_w} = \log (\frac{{{G_w}}}{{{P_w}}})\\ {t_h} = \log (\frac{{{G_h}}}{{{P_h}}}) \end{array}$

函数可以表示为 $d_*(P) = w_*^T \phi _5 (P)$ ， $\phi _5 (P)$ 是当前proposal的特征向量， $w_*$ 是要学习的参数，因此loss可以表示为

L = \sum i = 1 N (t i * - w T * ϕ 5 P (i)) 2

$L = \sum\limits_{i = 1}^N {{{(t_*^i - w_*^T{\phi _5}P(i))}^2}}$

也可以加上L1 loss或者L2 loss，防止过拟合，可以使用最小二乘法进行求解。

参考链接

https://blog.csdn.net/zijin0802034/article/details/77685438

littletomatodonkey

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
bounding box regression讲解

简介bbox回归指的是使用变换的方法，将当前预测的bbox进行变换，使其更加接近gt box。对于一般的bbox，可以由 x,y,w,hx,y,w,hx,y,w,h 4个变量进行表示，将我们的目标抽象为给定原始的proposal PPP，将groundtruth box记为GGG，我们希望能够找到一个变换关系，使得原始框可以映射得到一个更接近gt box的回归窗口G^G^\hat G。...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

littletomatodonkey 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。