计算机视觉基础-4——物体检测

最新推荐文章于 2024-05-31 07:54:23 发布

dianshu9815

最新推荐文章于 2024-05-31 07:54:23 发布

阅读量470

点赞数

文章标签：人工智能

原文链接：http://www.cnblogs.com/leokale-zz/p/11163243.html

版权

一、什么是目标检测

即用框（bounding box）标出物体的位置，并给出物体的类别

一些数据集介绍：

PASCAL VOC数据集http://host.robots.ox.ac.uk/pascal/VOC/ 20类物体

COCO数据集 http://cocodataset.org/#home 80类物体

二、IoU介绍

IoU：Intersection over Union，交并比。

解释：

1.绿色框为我们认为标定的框。

2.红色框为预测的框。

3.我们计算两个框的交集和并集。

4.交集/并集就是IoU。

三、PR曲线绘制

PR曲线：precision-recall curve。用于评价检测器性能。

PR曲线如何绘制：

如上图所示，我们给定了3个人工绘制的框（绿色）：

检测器输出了5个红色框：

其中得分表示检测器框住的东西是人的概率。我们先将其按这个得分排序：

排好序后，我们按得分从高到低，将框与人工绘制的框进行计算IoU，当IoU大于一个阈值时，我们打上TP的标签。

注意：每个绿色框只能匹配一次，例如1号红框与1号绿框匹配，IoU=0.9，那么1号红框标注TP，为真正例。2号红框也与1号绿框匹配，IoU=0.8，此时只能标注其为FP，即假正例。在这种情况下，上表中出现TP的个数最多就等于3。也就是说召回率最大不能超过1。

准确率（Precision）和召回率（Recall）：

我们设定不同的阈值，在每一个阈值情况下计算P和R的值，并绘成PR曲线：

解释：

1.由于检测器输出只有5个框，最低得分是0.7，假设阈值为低于0.7，例如取0.6。计算P=3/5=0.6，R=3/3=1。

2.假设阈值为0.7。P=3/4=0.75，R=3/3=1。

3.假设阈值为0.8。P=3/3=1，R=3/3=1。

4.假设阈值为0.9。P=3/3=1，R=2/3=0.67。

5.假设阈值为0.9。P=3/3=1，R=1/3=0.33。

画成PR曲线，如下图：

直观理解：

　　假设我们在这个例子中，检测器输出了很多很多红色框，例如100个框，他们的得分从高到低排列。假设我们将阈值取得很低，例如0.3，那么大量的框很有可能包含了所有需要检测的物体（例如30个物体），那么Recall就为1（Recall就是一共需要检测的物体中，我们检测到了的比例）。但是，由于大量的框大部分都是不准确的（只有30个框是准确框住了物体），那么准确率（Precision）就非常低（只有30%）。

　　反之，我们将阈值设置得非常高，例如0.95，那么排在前面3位的框确实框住了物体，但是需要检测的物体可能有30类，虽然这3个框都框住了物体（Precision为1），但是召回率却只有3/30=10%。

如何使用PR曲线评价一个检测器：

　　我们采用PR曲线下面所包含的面积大小来评价一个检测器，面积越大，检测器越好。

看下面这个情况：

排名第一的红框没有框住物体，这种情况下他属于假正例（FP），那么这种情况下得PR曲线如右边所示，当阈值为0.9时，Precision和Recall都为0。

转载于:https://www.cnblogs.com/leokale-zz/p/11163243.html

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。