Faster RCNN Review(2)：Label的生成

最新推荐文章于 2021-02-04 12:07:59 发布

Richard_Che

最新推荐文章于 2021-02-04 12:07:59 发布

阅读量682

点赞数 2

分类专栏： FasterRCNN 文章标签：人工智能深度学习计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/richard_che/article/details/105852181

版权

本文详细介绍了Faster R-CNN中RPN部分的Label生成过程，包括单目标和多目标分类Label的生成。针对每个Anchor，计算与Ground Truth框的IoU，根据IoU阈值确定正负样本，生成最终的分类Label。对于多目标情况，通过堆叠不同GT框的IoU Map并取通道最大值来确定 Anchor 的分类Label。

摘要由CSDN通过智能技术生成

Label的生成(RPN)

RPN部分的Label，是连同数据增广，在送入网络训练之前就已经生成好的。由于检测需要解决的是2个问题：坐标的回归&坐标点的分类，自然地这里的Label包含的是2方面：分类Label的生成&回归Label的生成。本文先介绍分类Label的生成

单目标分类Label的生成（RPN）

假设原图大小为 $H * W$ ，有9个anchor，Feature Map stride为16，那么最终关于分类的样本维度为 H/stride * W/stride * numanchor，即 H/16 * W/16 * 9，下面将结合实际图例，说明分类样本产生的过程。

这里举例一种简单的情况：原图的大小为768 * 1024，为了适配网络（1024 * 1024），我们在底部补黑边(0,0,0)。图中只有1个框，坐标为 $x_0,y_0,x_1,y_1) = (266.24,241.664,1009.664,724.992)$ ，如下图所示。
在这里插入图片描述

这里先给出最终生成的，每个Anchor下的分类Label。其中-1代表Ignore，实际训练中不会回传该部分的梯度；0代表负样本，即背景；1代表正样本，即目标。
在这里插入图片描述

可以看到，大部分的Anchor，对应的Label，不是0就是-1，只有Anchor 6中有少部分的目标。但具体是为什么，而每个点对应的值是如何计算的，下面给出说明。
分类Label的生成，涉及到以下的变量：

Anchor Map：上文提到的

最低0.47元/天解锁文章

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。