YOLO系列笔记(一)——YOLO介绍与衡量指标
深度学习经典检测方法
深度学习中有两种经典的目标检测方法:
- 两阶段(Two-Stage)方法:代表性算法包括 Faster R-CNN 和 Mask R-CNN 等(见图一)。
- 单阶段(One-Stage)方法:代表性算法包括 YOLO 系列(见图二)。
两两比较
单阶段 (One-Stage)
- 核心优点: 速度快,能够实时处理图像,因此在需要快速响应的应用场景中受到广泛欢迎。
- 缺点: 相对于两阶段方法,单阶段方法在目标检测的准确性方面可能略有不足,尤其是在处理复杂场景或小目标时。
两阶段 (Two-Stage)
通常情况下,两阶段方法的处理速度较慢(大约5帧每秒),但通常能够实现较好的检测效果。下图展示了一个常用的 Mask R-CNN 框架。其中的 RPN(Region Proposal Network)部分是整个网络的核心。该网络首先提取候选区域,然后对候选区域进行分类和边界框回归,从而实现目标检测和定位。虽然这种方法速度较慢,但在精度上通常能够取得较好的表现。
衡量指标
精度和召回率
精度(Precision)和召回率(Recall)是深度学习中常用的评价指标,用于衡量模型在目标检测任务中的性能表现。它们的公式如下:
P
r
e
c
i
s
i
o
n
=
T
P
T
P
+
F
P
Precision = \frac{TP}{TP+FP}
Precision=TP+FPTP
R
e
c
a
l
l
=
T
P
T
P
+
F
N
Recall = \frac{TP}{TP+FN}
Recall=TP+FNTP
其中,TP 表示 True Positives,FP 表示 False Positives,FN 表示 False Negatives,TN表示True Negatives。
相关(Relevent) | 无关(NonRelevent) | |
---|---|---|
被检索到(Retrieved) | True Positives(TP) | False Positives(FP) |
未被检索到(Not Retrieved) | False Negatives(FN) | True Negatives(TN) |
对于上述表格的解释:
- 表头中的“相关”(Relevent)和“无关”(NonRelevent)指的是真实值(Ground Truth),即图像中是否存在特定对象(object)。
- 列标题中的“被检索到”(Retrieved)和“未被检索到”(Not Retrieved)指的是预测值(Prediction),即模型是否正确检测到了特定对象。
- 当图像中存在特定对象时,若模型成功检测到并识别了该对象,则为 True Positives (TP),否则为 False Negatives (FN)。
- 当图像中不存在特定对象时,若模型错误地将其检测为了该对象,则为 False Positives (FP),否则为 True Negatives (TN)。
总结:
- 精度(Precision)衡量了模型正确检测到的对象中,有多少是真正的对象。它是模型的预测结果中真正对象的比例。
- 召回率(Recall)衡量了真实对象中,模型成功检测到了多少。它是模型检测到的真正对象占所有真实对象的比例。
- 因此精度又被称为查准率,召回率又被称为查全率。
IOU指标
IOU(Intersection over Union)指标是衡量目标检测模型性能的重要指标之一,用于评估模型的检测准确度。它表示预测值(Prediction)与真实值(Ground Truth)之间的交集与并集的比例,其公式如下:
I
O
U
=
A
r
e
a
o
f
O
v
e
r
l
a
p
A
r
e
a
o
f
U
n
i
o
n
IOU = \frac{Area of Overlap}{Area of Union}
IOU=AreaofUnionAreaofOverlap
其中,Area of Overlap 表示预测值和真实值之间的交集区域的面积,Area of Union 表示预测值和真实值之间的并集区域的面积,见下图。
IOU指标的取值范围在0到1之间,数值越大表示模型的检测结果与真实情况越吻合。
置信度(confidence)
在目标检测任务中,**置信度阈值(confidence threshold)**是指模型对检测结果的信心度阈值,通常在0到1之间取值。通常情况下,模型会根据预测结果的置信度对目标进行分类和定位。
当置信度高于阈值时,模型认为该检测结果是可信的,否则将被视为噪声或误检。通过调整置信度阈值,可以控制模型的检测精度和召回率,从而达到不同的检测要求。
一般来说,较高的置信度阈值可以提高检测结果的准确性,但可能会降低召回率;而较低的置信度阈值则可能提高召回率,但会降低准确性。因此,在选择置信度阈值时需要权衡准确性和召回率之间的关系,根据具体应用场景来确定最合适的阈值。
平均指标MAP
MAP(Mean Average Precision)是目标检测任务中常用的评价指标之一,它是所有类别的平均精度(Average Precision)的平均值。
在目标检测任务中,每个类别都有自己的精度-召回率曲线(Precision-Recall Curve),这条曲线描述了在不同置信度阈值下模型的精度和召回率之间的关系。精度是检测出的目标中正确的比例,而召回率是真实目标中被正确检测出来的比例(见图一)。为了计算平均精度,首先需要计算每个类别的精度-召回率曲线下的面积(Area Under Curve,AUC)。然后,将所有类别的AUC取平均,即得到MAP。
在实际计算中,为了平滑曲线并减少噪声的影响,通常会对精度-召回率曲线进行插值处理,计算出插值精度(Interpolated Precision),再计算面积。最后,将所有类别的插值精度下的面积取平均,得到MAP(见图二)。
MAP是评价目标检测算法性能的重要指标,它综合考虑了模型在不同类别上的检测准确性和召回率,能够客观地评价模型的整体性能。