yolo原理笔记(最原始的算法推导) v1

前言:最近新入了目标检测的坑,查阅了一些相关的资料,整理一下笔记,和大家分享一下。这篇文章的内容非常基础,有很多深度学习的相关概念,都随手标注解释,所以篇幅可能会很长,可能读起来分不清主线,先这样写着,后面慢慢整理。

主要分为以下两个内容:

  1. 从整体的角度分析yolo
  2. 从零开始设计检测器

yolo:you only look once

一、yolo的性能

下图是一些经典的(Object Dectection model)目标检测模型EfficientDet(D0-D4), ASFF, ATSS, YOLO, CenterMark在MS COCO数据集上的表现,给出的几个模型都是目前性能比较好的,可以发现yolov4 在视频中的目标检测性能要远大于其他的模型,特别是针对于yolov3有接近两倍的速度提升,这使得有充分的理由去学习yolo的算法原理。

这里图片的纵横坐标分析:

FPS:视频的帧率,每秒可以处理视频流中的图片的个数。

AP: (Average Precision),AP就是平均精准度,是主流的目标检测模型的评价指标。简单来说就是对PR曲线上的Precision值求均值。对于pr曲线来说,我们使用积分来进行计算:

     

        如果想理解这个公式,需要知道IoU,Precision & Recall,PR曲线等概念

       1.  IoU(Intersection over union):交并比IoU衡量的是两个区域的重叠程度,是两个区域重叠部分面积占二者总面积(的比例。如下图,两个矩形框的IoU是交叉面积(中间图片红色部分)与合并面积(右图红色部分)面积之比。

通常在目标检测任务中,如果模型输出的矩形框与人工标注的矩形框的IoU值大于某个阈值时(通常为0.5)即认为模型输出了正确的结果。

          2. (Precision & Recall)

          Precision 和 Recall最早是信息检索中的概念,用来评价一个信息检索系统的优劣。Precision 就是检索出来的条目中(比如:文档、网页等)有多大比例是需要的,Recall就是所有需要的网页的条目有多大比例被检索出来了。用到目标检测领域,假设有一组图片,里面有若干待检测的目标,Precision就代表模型检测出来的目标有多打比例是真正的目标物体,Recall就代表所有真实的目标有多大比例被的模型检测出来了。换个更通俗的例子,10个花生和15个黄豆和25个玉米撒在一起,小明的妈妈让小明把他们都捡起来,说先让把玉米挑出来,小明嫌麻烦随便抓了一把,里面有5个花生、6个黄豆、7个玉米和8个小石子。

那么Precision = (5+6+7)/(5+6+7+8)     Recall = 7/(5+6+7+8) 

在目标检测中通常是这样使用的,如下图所示:(通常将IOU大于0.5的视为正确的,将IOU小于0.5的视为错误)

TP,即原本正确的,预测值也是正确的      v

FP,即原本错误的,预测值却是正确的      x

TN,即原本错误的,预测值也是错误的     v

FN,即原本正确的,预测值却是错误的      x

(1)TP就是【True P】;FP就是【False P】。都是站在预测的角度来描述的。

(2)P代表的是Positive【正类】; N表示的是Negative【负类】,站在标签的角度讲的。

                                                                                   

  3. PR曲线

         检测的结果P越高越好,R也越高越好,但事实上这两者在某些情况下是矛盾的。比如极端情况下,只检测出了一个结果,且是准确的,那么Precision就是100%,但是Recall就很低;而如果我们把所有结果都返回,那么必然Recall必然很大,但是Precision很低。

因此在不同的场合中需要判断希望P比较高还是R比较高。如果是做实验研究,可以绘制Precision-Recall曲线来帮助分析。

下面详细说明一PR曲线如何绘制,通过阅读上面的文章可以发现,计算P ,R 需要站在预测的角度,首先要解决的问题是什么样的预测值是错误的,什么样的预测值是正确的。此时需要一个阈值作为界限,大于这个阈值的为正确,小于这个阈值的为错误。

给定一个阈值,就能计算一个P值和一个R值,正如所想的那样,通过改变不同的阈值,就会得到不同的预测结果,这样就会得到一系列不同的点对(P, R),

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

两只蜡笔的小新

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值