边框回归

最新推荐文章于 2022-05-01 19:37:01 发布

qq_43152949

最新推荐文章于 2022-05-01 19:37:01 发布

阅读量274

点赞数

分类专栏：深度学习

原文链接：https://blog.csdn.net/zijin0802034/article/details/77685438

版权

深度学习专栏收录该内容

7 篇文章 0 订阅

订阅专栏

边框回归

边框回归是什么？

对于窗口一般使用四维向量（x，y，w，h）来表示，分别表示窗口的中心点坐标和宽高。对于图2，红色的框P代表原始的Proposal，绿色的框 G 代表目标的 Ground Truth，我们的目标是寻找一种关系使得输入原始的窗口 P 经过映射得到一个跟真实窗口 G 更接近的回归窗口
在这里插入图片描述

边框回归怎么做？

线性回归就是给定输入的特征向量X，学习一组参数W，使得经过线性回归后的值跟真实值非常接近，即 Y ≈ WX 。那么 Bounding-box中我们的输入以及输出分别是什么呢？

为什么宽高尺寸会涉及这种形式？

解释设计的tx， ty为什么除以宽高，为什么tw，th会有log形式。
首先CNN具有尺度不变性。
在这里插入图片描述
x,y 坐标除以宽高

宽高坐标Log形式

第一，(6, 7)两式对平移量除以宽和高的处理是为了做尺度归一化，因为大的box可能绝对偏移量会比小的box大，除以宽和高消除这种影响；第二，(8, 9)两式比值取对数是线性回归中的常见操作（参考对数线性回归），目的也是在一定程度上将数值的绝对变化转换为相对的变化。

为什么IoU较大，认为是线性变换？
在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
边框回归

边框回归边框回归是什么？对于窗口一般使用四维向量（x，y，w，h）来表示，分别表示窗口的中心点坐标和宽高。对于图2，红色的框P代表原始的Proposal，绿色的框 G 代表目标的 Ground Truth，我们的目标是寻找一种关系使得输入原始的窗口 P 经过映射得到一个跟真实窗口 G 更接近的回归窗口边框回归怎么做？线性回归就是给定输入的特征向量X，学习一组参数W，使得经过线性回归...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。