YOLOv1

最新推荐文章于 2024-12-11 09:25:55 发布

咸鱼の猫

最新推荐文章于 2024-12-11 09:25:55 发布

阅读量1.9k

点赞数 11

分类专栏： YOLO系列文章标签：目标检测

本文链接：https://blog.csdn.net/m0_59034641/article/details/127556677

版权

YOLO系列专栏收录该内容

4 篇文章

订阅专栏

本篇文章内容非100%原创，主要是学习博客，用以总结，如侵就删，本人是个菜鸡，如有不对，欢迎指正

文章目录

前言（部分内容摘抄自博主【秃头小苏】）

这部分主要讲述yolo系列各个版本的的原理，这部分会把yolov1到yolov5的原理进行详细的阐述。首先我们先来看深度学习的两种经典的检测方法：

Two-stage（两阶段）：代表-- Fsater-rcnn Mask-rcnn系列

One-stage（单阶段）：代表-- Yolo系列

两阶段和单阶段有什么样的区别呢，我们从整体上理解：单阶段的就是一步到位，我们输入一个图像，经过一系列传化，最终会得到一个输出结果；双阶段相较于单节段多了一些中间步骤，输入一个原始图像，我们会先得到一些中间值，最后才输出结果。更形象的表述为，我们要选择一个人当代表，代表安徽省踢球，那么双阶段就类似与我先在安徽各个市找一些好苗子，最后再从这些好苗子中选择一个最优秀的。具体可以参照下图：

既然两种检测方式有所区别，那自然会讨论他们的优缺点：

One-stage

优势：速度非常快，适合做实时检测任务
劣势：效果通常不会太好
Two-stage

优势：效果通常比较好
劣势：速度较慢，不适合做实时检测任务
其实他们的优缺点我们也很好理解，单阶段检测的没有中间过程，那速度肯定是相当哇塞了，但从效果来说，就相对差一点。我们可以看一下他们的对比（以单阶段的yolo和双阶段的Faster-rcnn为代表）

从上图可以看出，YOLO的mAP要低于Fast-rcnn,但是FPS却远高于Fast-rcnn。【FPS表示一个网络的检测速度，越大速度越快，mAP表示模型综合检测的效果，越大效果越好】

上面提到了一个术语：mAP。它表示的是一个综合检测的效果，因为表示模型效果的评价指标有很多，像IOU、precision、recall等，下面先来介绍这三个参数：

IOU：

真实框和预测框之间的交并比，可以反映两个框之间的距离

Precision（精度）和Recall（召回率）

精度表示分类的准确性，它等于将（正类分类正确）与（正类分类正确和错误）的比例

召回率的含义是表示（正类分类正确）与（正类分类正确和把正类判断成负类）的比值。简单来说，recall表示的就是一些没有检测到的物体的比例，比如一张图片有10个目标需要检测，一种方法你检测到了10种目标，那你的召回率就好；而另一种方法只检测到了8个图片，那么你的召回率就不好。

TP（真阳）——Ture Positives（表示判断正确，把正类判断成正类）
FP（假阳）——False Positives（表示判断错误，把负类判断成正类）
FN(假阴)——False Negatives（表示判断错误，把正类判断成负类）
TN（真阴）——True Negatives（表示判断正确，把负类判断成负类）

举例说明

已知：班级共100人，其中男生80人，女生20人

目标：找出所有女生

结果：从班级中选择了50人才找出20个女生，也即错误的把30名男生也挑选出来了

则

TP=20 【把正类判断成正类，即找到的20个女生】
FP=30 【把负类判断成正类，即将30个男生看做女生】
FN=0 【把正类判断成负类，这里为0，所以女生都被选出来了】
TN=50 【把负类判断成负类，即剩下的没有选出来的50个男生】

precision=20/(20+30)=2/5

recall=20/(20+0)=1

知道了precision和recall，这两个指标都可以表示检测的效果，为了综合表示检测效果，产生了mAP。首先先介绍什么是AP？AP事实上指的是，我们取不同的置信度，可以获得不同的Precision和不同的Recall，当我们取置信度足够密集的时候，就可以获得非常多的Precision和Recall。利用不同的Precision和Recall的点的组合，画出来的曲线下面的面积即为AP的大小。如下图所示：