边框回归Bounding-Box regression

最新推荐文章于 2024-07-07 11:49:30 发布

a little cabbage

最新推荐文章于 2024-07-07 11:49:30 发布

阅读量378

点赞数

分类专栏：深度学习文章标签：回归数据挖掘人工智能

本文链接：https://blog.csdn.net/weixin_43937959/article/details/122208890

版权

深度学习专栏收录该内容

22 篇文章 0 订阅

订阅专栏

边框回归是什么？

如下图：
对于边框，一般使用向量(x,y,w,h) 来表示，分别表示窗口的中心点坐标和宽高。红色的框 P 代表原始的Proposal。绿色的框 G 代表目标的 Ground Truth；
在这里插入图片描述
我们的目标是寻找一种关系，使得原始输入框P(红色的框)经过映射得到一个 Ground Truth（绿色框）更接近的回归看框 $\widehat{G}$ (蓝色框)。所以，边框回归的目的即是：给定(Px,Py,Pw,Ph)寻找一种映射f，使得：f(Px,Py,Pw,Ph) = ( $\widehat{Gx}$ , $\widehat{Gy}$ , $\widehat{Gw}$ , $\widehat{Gh}$ )并且( $\widehat{Gx}$ , $\widehat{Gy}$ , $\widehat{Gw}$ , $\widehat{Gh}$ )≈(Gx,Gy,Gw,Gh)
边框回归怎么做？比较简单的思路就是: 平移+尺度缩放
在这里插入图片描述
其中，坐标乘以宽高是为了以平移的比例来计算，而宽高使用指数形式是为了保证缩放比例为正数。那么可以求出目标变换t*(.)为：
$t_x = (\hat{G_x} - P_x) / P_w$
$t_y = (\hat{G_y} - P_y) / P_h$
$t_w = log(\hat{G_w} / P_w)$
$t_h = log(\hat{G_h} / P_h)$

a little cabbage

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
边框回归Bounding-Box regression

边框回归是什么？如下图：对于边框，一般使用向量(x,y,w,h) 来表示，分别表示窗口的中心点坐标和宽高。红色的框 P 代表原始的Proposal。绿色的框 G 代表目标的 Ground Truth；我们的目标是寻找一种关系，使得原始输入框P(红色的框)经过映射得到一个 Ground Truth（绿色框）更接近的回归看框G^\widehat{G}G(蓝色框)。所以，边框回归的目的即是：给定(Px,Py,Pw,Ph)寻找一种映射f，使得：f(Px,Py,Pw,Ph) = (Gx^\wideha
复制链接

扫一扫

专栏目录