目标检测最常用的评价指标是mAP,mAP是介于0到1之间的一个数字,这个数字越接近于1,就表示你的模型的性能更好。
一般我们会接触到两个指标,分别是召回率recall和精度precision,两个指标p和r都是简单地从一个角度来判断模型的好坏,均是介于0到1之间的数值,其中接近于1表示模型的性能越好,接近于0表示模型的性能越差,为了综合评价目标检测的性能,一般采用均值平均密度map来进一步评估模型的好坏。我们通过设定不同的置信度的阈值,可以得到在模型在不同的阈值下所计算出的p值和r值,一般情况下,p值和r值是负相关的,绘制出来可以得到如下图所示的曲线,其中曲线的面积我们称AP,目标检测模型中每种目标可计算出一个AP值,对所有的AP值求平均则可以得到模型的mAP值,以本文为例,我们可以计算佩戴安全帽和未佩戴安全帽的两个目标的AP值,我们对两组AP值求平均,可以得到整个模型的mAP值,该值越接近1表示模型的性能越好。
Epoch gpu_mem box obj cls total labels img_size
Epoch:训练过程中的迭代次数(即完成了多少个epoch)。
gpu_mem:GPU内存使用情况,通常是以MB或GB为单位的数字。
box:模型预测出的bounding box的平均损失值。
obj:模型预测出的objectness的平均损失值。
cls:模型预测出的分类的平均损失值。
total:所有损失值的总和,即box+obj+cls。
labels:每个batch中标注的物体数量的平均值。
img_size:输入模型的图像的大小,通常是以像素为单位的宽度和高度。
这些参数的意义可以帮助训练者监控模型的训练过程,以便在必要时进行调整和优化。
Class Images Labels P R mAP@.5 mAP@.5:.95
Class:检测的目标类别。
Images:测试集中包含该类别的图像数量。
Labels:测试集中该类别物体的真实标注数量。
P:该类别的预测精确度(precision),即正确预测的物体数量占所有预测的物体数量的比例。
R:该类别的召回率(recall),即正确预测的物体数量占所有真实物体数量的比例。
mAP@.5:平均精度均值(mean average precision)的值,即在IoU阈值为0.5时的平均精度。
mAP@.5:.95:在IoU阈值从0.5到0.95的范围内,所有阈值的平均精度的均值。
这些指标的意义是,P和R可以帮助评估模型的分类和检测能力,mAP则综合了模型在不同IoU阈值下的表现,是评估模型性能的主要指标之一。