边框回归

边框回归

边框回归是什么?

对于窗口一般使用四维向量(x,y,w,h)来表示,分别表示窗口的中心点坐标和宽高。对于图2,红色的框P代表原始的Proposal,绿色的框 G 代表目标的 Ground Truth, 我们的目标是寻找一种关系使得输入原始的窗口 P 经过映射得到一个跟真实窗口 G 更接近的回归窗口
在这里插入图片描述
在这里插入图片描述
边框回归怎么做?
在这里插入图片描述
线性回归就是给定输入的特征向量X,学习一组参数W,使得经过线性回归后的值跟真实值非常接近,即 Y ≈ WX 。那么 Bounding-box中我们的输入以及输出分别是什么呢?
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
为什么宽高尺寸会涉及这种形式?

解释设计的tx, ty为什么除以宽高, 为什么tw,th会有log形式。
首先CNN具有尺度不变性。
在这里插入图片描述
x,y 坐标除以宽高
在这里插入图片描述
宽高坐标Log形式
在这里插入图片描述
第一,(6, 7)两式对平移量除以宽和高的处理是为了做尺度归一化,因为大的box可能绝对偏移量会比小的box大,除以宽和高消除这种影响;第二,(8, 9)两式比值取对数是线性回归中的常见操作(参考对数线性回归),目的也是在一定程度上将数值的绝对变化转换为相对的变化。

为什么IoU较大,认为是线性变换?
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值