模型评估笔记

飞浪嗷呦

已于 2023-05-25 20:45:39 修改

阅读量155

点赞数

文章标签：深度学习计算机视觉人工智能

于 2023-05-25 15:09:22 首次发布

本文链接：https://blog.csdn.net/HUCHENG_02/article/details/130866826

版权

文章介绍了目标检测中常用的评价指标，包括mAP、召回率和精度，以及它们在评估模型性能中的作用。mAP是综合评价模型在不同IoU阈值下表现的关键指标，而召回率和精度则分别反映了模型的检测全面性和准确性。此外，文章还提及了训练过程中的关键参数，如GPU内存使用和损失值，以及如何利用这些信息优化模型。

摘要由CSDN通过智能技术生成

目标检测最常用的评价指标是mAP，mAP是介于0到1之间的一个数字，这个数字越接近于1，就表示你的模型的性能更好。

一般我们会接触到两个指标，分别是召回率recall和精度precision，两个指标p和r都是简单地从一个角度来判断模型的好坏，均是介于0到1之间的数值，其中接近于1表示模型的性能越好，接近于0表示模型的性能越差，为了综合评价目标检测的性能，一般采用均值平均密度map来进一步评估模型的好坏。我们通过设定不同的置信度的阈值，可以得到在模型在不同的阈值下所计算出的p值和r值，一般情况下，p值和r值是负相关的，绘制出来可以得到如下图所示的曲线，其中曲线的面积我们称AP，目标检测模型中每种目标可计算出一个AP值，对所有的AP值求平均则可以得到模型的mAP值，以本文为例，我们可以计算佩戴安全帽和未佩戴安全帽的两个目标的AP值，我们对两组AP值求平均，可以得到整个模型的mAP值，该值越接近1表示模型的性能越好。

准确率、精确率、召回率、ROC和AUC

召回率

Epoch gpu_mem box obj cls total labels img_size

Epoch：训练过程中的迭代次数（即完成了多少个epoch）。
gpu_mem：GPU内存使用情况，通常是以MB或GB为单位的数字。
box：模型预测出的bounding box的平均损失值。
obj：模型预测出的objectness的平均损失值。
cls：模型预测出的分类的平均损失值。
total：所有损失值的总和，即box+obj+cls。
labels：每个batch中标注的物体数量的平均值。
img_size：输入模型的图像的大小，通常是以像素为单位的宽度和高度。
这些参数的意义可以帮助训练者监控模型的训练过程，以便在必要时进行调整和优化。

Class Images Labels P R mAP@.5 mAP@.5:.95

Class：检测的目标类别。
Images：测试集中包含该类别的图像数量。
Labels：测试集中该类别物体的真实标注数量。
P：该类别的预测精确度（precision），即正确预测的物体数量占所有预测的物体数量的比例。
R：该类别的召回率（recall），即正确预测的物体数量占所有真实物体数量的比例。
mAP@.5：平均精度均值（mean average precision）的值，即在IoU阈值为0.5时的平均精度。
mAP@.5:.95：在IoU阈值从0.5到0.95的范围内，所有阈值的平均精度的均值。
这些指标的意义是，P和R可以帮助评估模型的分类和检测能力，mAP则综合了模型在不同IoU阈值下的表现，是评估模型性能的主要指标之一。