RCNN中的bounding box regression详解

最新推荐文章于 2022-12-23 20:59:08 发布

CV_adventurer

最新推荐文章于 2022-12-23 20:59:08 发布

阅读量3.2k

点赞数 1

分类专栏： deep learning

deep learning 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

总结下上面大神所陈述的内容：

1.关于公式1~4是怎么来的，从原paper来看，作者是引入了scale-invariant translation 分别对于x和y，即对于xy坐标引入同一个scale，加上作者在他的另一篇论文Rich feature hierarchies for accurate object detection and semantic segmentation 中阐述的“ proposal region不能和ground truth相差太远”（两者iou>0.6)如果相差太远是无法得到boundingbox regression的，所以在公式1~2中相当于将dx和dy regularize 在一定的数值范围内，即dx = (Gx-Px)/Pw 这里Gx是近似groundtruth 的 predicted 值。

同理对于dw和dh，作者引入log-space translation，也是将(Gw,Pw）这对差距规划入一个小的范围内，即 dw = log(Gw/Pw)。所以在最终的loss function中就相当于平均分配了xy 和wh的loss比例，不会因为wh的loss过大忽略了xy的loss，反之亦然。

2. 训练该regression 输入为(（G, P）一组训练example） + (CNN pool5的feature 即 lossfunction中的 SITA(P), 为了得到 parameter w* 。其中(G,P) pair用来求出 t* 。lossfunction 第一部分为数据loss 第二部分为正则化。

测试阶段输入为CNN pool5提取出的feature SITA(P)，通过线性模型 w* 乘以 SITA(P）就得出 dx，dy，dw，dh，这四个值有了就有了新的 bounding box

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
RCNN中的bounding box regression详解

RCNN bounding box
复制链接

扫一扫

专栏目录

CV_adventurer CSDN认证博客专家 CSDN认证企业博客

码龄7年

0: 原创

54万+: 周排名

138万+: 总排名

4万+: 访问

: 等级

269: 积分

16: 粉丝

11: 获赞

16: 评论

31: 收藏

私信

关注

热门文章

分类专栏

最新评论

Python生成PASCAL VOC格式的xml标注文件
我擦嘞发达水果店回复 jiachen0212: 直接打开文件，把xml写进去，不要写dom
Caffe学习系列——Faster-RCNN训练自己的数据集
Always Believe ...: 博主你的图片挂掉啦
Caffe学习系列——Faster-RCNN训练自己的数据集
又是努力搬砖的一天: 2. 修改lib/datasets/pascal_voc.py，将类别改成自己的类别这里有一个注意点就是，这里的类别以及你之前的类别名称最好是全部小写，假如是大写的话，则会报keyError的错误，这时只需要在pascal_voc。py中第218行的lower去掉即可想问下博主这里的去掉lower是要把这一句怎么修改呢？ cls = self._class_to_ind[obj.find('name').text.lower().strip()]
Caffe学习系列——Faster-RCNN训练自己的数据集
qq_23496129: 博主，想问你训练deepfashion数据集的时候是利用的数据集自己带的Bbox信息还是自己重新标注的呢
Caffe学习系列——Faster-RCNN训练自己的数据集
小孺牛: 博主。IndexError: list index out of range 遇到这个问题怎么解决，您并没有写

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。