深度学习性能评估指标介绍

最新推荐文章于 2025-05-16 15:32:39 发布

倾城一少

最新推荐文章于 2025-05-16 15:32:39 发布

阅读量665

点赞数

分类专栏：机器学习 deep learning 文章标签：深度学习人工智能

本文链接：https://blog.csdn.net/u010329292/article/details/128755439

版权

17 篇文章

订阅专栏

5 篇文章

订阅专栏

首先是相关数据描述。假设原始样本中有两类数据，其中：

经过分类后：

精确率是针对我们预测结果而言的，它表示的是预测为正的样本中有多少是对的。那么预测为正就有两种可能了，一种就是把正类预测为正类(TP)，另一种就是把负类预测为正类(FP)。它反映的是被分类器判定的正例中真正的正例样本的比重。

它反映的是分类器统对整个样本的判定能力——能将正的判定为正，负的判定为负的能力。

召回率是针对我们原来的样本而言的，它表示的是样本中的正例有多少被预测正确了。那也有两种可能，一种是把原来的正类预测成正类(TP)，另一种就是把原来的正类预测为负类(FN)。也称为True Positive Rate(TPR)，它反映了被正确判定的正例占总的正例的比重。

下图直观反映了精确率与召回率的关系。

在逻辑回归中，我们会设一个阈值，大于这个值的为正类，小于这个值为负类。如果我们减小这个阀值，那么更多的样本会被识别为正类。这会提高正类的识别率，但同时也可能使得更多的负类被错误识别为正类。为了形象化这一变化，引入ROC，ROC曲线可以用于评价一个分类器好坏。

ROC关注两个指标：True Positive Rate(TPR)和False Positive Rate(FPR)。

直观上，TPR代表能将正例分对的概率，FPR代表将负例错分为正例的概率。在ROC空间中，每个点的横坐标是FPR，纵坐标是TPR，这也就描绘了分类器在TP（真正率）和FP（假正率）间的trade-off。

AUC（Area Under Curve）被定义为ROC曲线下的面积，显然这个面积的数值不会大于1。

The AUC value is equivalent to the probability that a randomly chosen positive example is ranked higher than a randomly chosen negative example.

翻译过来就是，随机挑选一个正样本以及一个负样本，分类器判定正样本的值高于负样本的概率就是AUC值。简单说：AUC值越大的分类器，正确率越高。

既然已经这么多评价标准，为什么还要使用ROC和AUC呢？因为ROC曲线有个很好的特性：当测试集中的正负样本的分布变化的时候，ROC曲线能够保持不变。在实际的数据集中经常会出现类不平衡（class imbalance）现象，即负样本比正样本多很多（或者相反）。

平均绝对误差MAE（Mean Absolute Error）又被称为l1范数损失（l1-norm loss）。

平均平方误差 MSE（Mean Squared Error）又被称为l2范数损失（l2-norm loss）。