Object Detection 之基础知识 (02)

以下知识来自网易云课堂:深度学习:算法到实战

目录

一、评价标准

二、滑动窗口

三、目标候选框生成(Object Proposal generation)

 四、难负样本挖掘(Hard Negative Mining)

五、 非极大值拟制(Non-Maximum Suppression)

六、边界框回归(Bounding Box Regression)


一、评价标准

1,准确率(Precision): 正确预测为正类的样本占所有预测为正类的比例 (所有预测为正类的样本中有多少是真正为正类)

2,召回率(Recall):正确预测为正类的样本占所有实际为正类样本的比例(所有为正类的样本中有多少被预测为正类)

      其中P为预测结果区域Prediction,G 为目标区域Ground Truth

3,交并比(IOU, Intersection-over-Union): 

 

二、滑动窗口

传统的方法是用一个滑动窗口,从左到右,从上到下滑动,匹配窗口内是否含有目标。下面的需要滑动512x512次(上下步长为1)

三、目标候选框生成(Object Proposal generation)

使用一些方法去生成目标候选框,可能就几百个或几千个候选框,而传统的滑动窗口法,窗口可能会有几万个或是几十万个。

目标候选框生成方法,代表算法有:

 

其中SS常用在经典目标检测算法中,比如R-CNN,Fast-RCNN

SS:首先,对输入图像进行分割算法(Graph-Based Image Segmentation)产生许多小的子区域。其次,根据这些子区域之间相似性(相似性标准主要有颜色、纹理、大小等等)进行区域合并,不断的进行区域迭代合并。每次迭代过程中对这些合并的子区域做bounding boxes(外切矩形),这些子区域外切矩形就是通常所说的候选框。

 四、难负样本挖掘(Hard Negative Mining)

 

negative相对于positive,是相对于正样本来说,不含有目标的负样本。但是,negative包括很多,有完全不包含目标的的,也有部分含有的,其中比较容易被判定是负样本(比如全是背景)的对于训练并不能起到很好的监督作用。我们需要找一些难划分的负样本,也就是hard negative,来增强网络的判别性能。

1,我们先用初始的正负样本(一般是正样本+与正样本同规模的负样本的一个子集)训练分类器,;

2,然后再用训练出的分类器对样本进行分类, 把其中负样本中错误分类的那些样本(hard negative)放入负样本集合, 再继续训练分类器;

3, 如此反复, 直到达到停止条件(比如分类器性能不再提升). 这个过程就是 Hard Negative Mining。

五、 非极大值拟制(Non-Maximum Suppression)

NMS:

1,在进行目标检测时一般会采取窗口滑动的方式,在图像上生成很多的候选框,然后把这些候选框进行特征提取后送入分类器,一般会得出一个得分(score),比如人脸检测,会在很多框上都有得分;

2,然后把这些得分全部排序。选取得分最高的那个框,接下来计算其他的框与当前框的重合程度(overlap);

3,如果重合程度大于一定阈值就删除,因为在同一个脸上可能会有好几个高得分的框,都是人脸但是不需要那么框我们只需要一个就够了。

注:那么肯定有人会好奇,如果图片中有好几个人脸,你这选取一个最大的,那第二个人脸怎么办呢。

实际上这是一个迭代的过程,第一步的非极大值抑制就是选取了某一个最大的得分,然后删除了他周边的几个框,第二次迭代的时候在剩下的框里面选取一个最大的,然后再删除它周围重叠区域大于一定阈值的,这样不停的迭代下去就会得到所有想要找到的目标物体的区域。

六、边界框回归(Bounding Box Regression)

红色框口P表示建议框Region Proposal,绿色窗口G表示实际框Ground Truth,红色窗口G^表示Region Proposal进行回归后的预测窗口,现在的目标是找到P到G^的线性变换,使得G^与G越相近,这就相当于一个简单的可以用最小二乘法解决的线性回归问题。

 

 

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Mr.Q

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值