Object Detection 之基础知识 (02)

最新推荐文章于 2022-04-21 00:00:21 发布

Mr.Q

最新推荐文章于 2022-04-21 00:00:21 发布

阅读量567

点赞数

分类专栏： Object Detection

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jizhidexiaoming/article/details/88317977

版权

Object Detection 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

以下知识来自网易云课堂：深度学习：算法到实战

目录

一、评价标准

二、滑动窗口

三、目标候选框生成（Object Proposal generation）

四、难负样本挖掘（Hard Negative Mining）

五、非极大值拟制（Non-Maximum Suppression）

六、边界框回归（Bounding Box Regression）

一、评价标准

1，准确率（Precision）: 正确预测为正类的样本占所有预测为正类的比例（所有预测为正类的样本中有多少是真正为正类）

2，召回率（Recall）：正确预测为正类的样本占所有实际为正类样本的比例（所有为正类的样本中有多少被预测为正类）

其中P为预测结果区域Prediction，G 为目标区域Ground Truth

3，交并比（IOU, Intersection-over-Union）:

二、滑动窗口

传统的方法是用一个滑动窗口，从左到右，从上到下滑动，匹配窗口内是否含有目标。下面的需要滑动512x512次（上下步长为1）

三、目标候选框生成（Object Proposal generation）

使用一些方法去生成目标候选框，可能就几百个或几千个候选框，而传统的滑动窗口法，窗口可能会有几万个或是几十万个。

目标候选框生成方法，代表算法有：

其中SS常用在经典目标检测算法中，比如R-CNN，Fast-RCNN

SS：首先，对输入图像进行分割算法（Graph-Based Image Segmentation）产生许多小的子区域。其次，根据这些子区域之间相似性(相似性标准主要有颜色、纹理、大小等等)进行区域合并，不断的进行区域迭代合并。每次迭代过程中对这些合并的子区域做bounding boxes(外切矩形)，这些子区域外切矩形就是通常所说的候选框。

四、难负样本挖掘（Hard Negative Mining）

negative相对于positive，是相对于正样本来说，不含有目标的负样本。但是，negative包括很多，有完全不包含目标的的，也有部分含有的，其中比较容易被判定是负样本（比如全是背景）的对于训练并不能起到很好的监督作用。我们需要找一些难划分的负样本，也就是hard negative，来增强网络的判别性能。

1，我们先用初始的正负样本(一般是正样本+与正样本同规模的负样本的一个子集)训练分类器,；

2，然后再用训练出的分类器对样本进行分类, 把其中负样本中错误分类的那些样本(hard negative)放入负样本集合, 再继续训练分类器；

3，如此反复, 直到达到停止条件(比如分类器性能不再提升). 这个过程就是 Hard Negative Mining。

五、非极大值拟制（Non-Maximum Suppression）

1，在进行目标检测时一般会采取窗口滑动的方式，在图像上生成很多的候选框，然后把这些候选框进行特征提取后送入分类器，一般会得出一个得分（score），比如人脸检测，会在很多框上都有得分;

2，然后把这些得分全部排序。选取得分最高的那个框，接下来计算其他的框与当前框的重合程度（overlap）；

3，如果重合程度大于一定阈值就删除，因为在同一个脸上可能会有好几个高得分的框，都是人脸但是不需要那么框我们只需要一个就够了。

注：那么肯定有人会好奇，如果图片中有好几个人脸，你这选取一个最大的，那第二个人脸怎么办呢。

实际上这是一个迭代的过程，第一步的非极大值抑制就是选取了某一个最大的得分，然后删除了他周边的几个框，第二次迭代的时候在剩下的框里面选取一个最大的，然后再删除它周围重叠区域大于一定阈值的，这样不停的迭代下去就会得到所有想要找到的目标物体的区域。

六、边界框回归（Bounding Box Regression）

红色框口P表示建议框Region Proposal，绿色窗口G表示实际框Ground Truth，红色窗口G^表示Region Proposal进行回归后的预测窗口，现在的目标是找到P到G^的线性变换，使得G^与G越相近，这就相当于一个简单的可以用最小二乘法解决的线性回归问题。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Mr.Q 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。