在二分类问题中,通常会使用以下三个指标来评估模型的性能:查准率(Precision)、查全率(Recall)和准确率(Accuracy)。
-
查准率(Precision):表示所有预测为正例的样本中,真正为正例的样本占比。计算公式为 Precision = TP / (TP + FP),其中 TP 表示真正例的数量,FP 表示假正例的数量。查准率越高,说明模型预测为正例的样本中真正为正例的比例越高,模型的误判率越低。
-
查全率(Recall):表示所有真正为正例的样本中,被模型预测为正例的样本占比。计算公式为 Recall = TP / (TP + FN),其中 TP 表示真正例的数量,FN 表示假反例的数量。查全率越高,说明模型能够识别更多的正例样本,漏判率越低。
-
准确率(Accuracy):表示所有样本中,被正确预测的样本占比。计算公式为 Accuracy = (TP + TN) / (TP + TN + FP + FN),其中 TP 表示真正例的数量,TN 表示真反例的数量,FP 表示假正例的数量,FN 表示假反例的数量。准确率越高,说明模型对所有样本的预测准确性越高。