机器学习模型的常用评价指标_比较机器学习模型效用logloss-CSDN博客

本文链接：https://blog.csdn.net/w1301100424/article/details/90518340

本文详细介绍了机器学习模型的评价指标，包括分类模型的准确率、精确率、召回率、FPR、ROC曲线和AUC，以及Log Loss。在回归模型中，讨论了MAE、MSE、RMSE和MSLE等指标。这些指标帮助我们评估模型的预测性能。

摘要由CSDN通过智能技术生成

分类模型的评价指标

TP(True Positives)：预测为正样本，实际上也为正样本的样本数；
FP(False Positives)：预测为正样本，实际上为负样本的样本数；
TN(True Negatives)：预测为负样本，实际上也为负样本的样本数；
FN(False Negatives)：预测为负样本，实际上为正样本的样本数。
通过下面的图片可以直观的理解这几个概念。
准确率(Accuracy)。所有预测正确的样本占总样本的比例。
$Accuracy=\frac{TP+TN}{TP+FP+TN+FN}$
精确率(Precision)。正确的预测为正的样本占所有预测为正的样本的比例。
$Precision=\frac{TP}{TP+FP}$
TPR(True Positive Rate)。正确预测为正的样本占所有正样本的比例，即在所有真实正样本中被正确分类的样本比例。
$TPR=\frac{TP}{TP+FN}$
FPR(False Positive Rate)。错误预测为正的样本占所有负样本的比例，即在所有负样本中被错误分类的比例。
$FPR=\frac{FP}{FP+TN}$
召回率(Recall)。
$Recall=\frac{TP}{TP+FN}$
知道了TPR和FPR的概念后，就很容易得到ROC(Receiver operating characteristic)曲线，ROC曲线是以TPR为纵坐标，以FPR为横坐标形成的曲线，如下图所示。

图中由ROC曲线包围的面积称为AUC(Area under the ROC Curve)。AUC的值介于0和1之间，可以等于0或者1,AUC的值越大表示模型的分类效果越好。