很多书中都用TP、FP、FN、TN来表示数据的真实情况和预测情况的比例,用一个表来形象地看下数据的真实分布。
TrueLabel(真实情况) | |||
阳 | 阴 | ||
PredictedLabel (预测情况) | 阳 | 真正例(TP) True Positive 真实阳,预测阳 | 假正例(FP) False Positive 真实阴,预测阳 |
阴 | 假负例(FN) False Negative 真实阳,预测阴 | 真负例(TN) True Negative 真实阴,预测阴 |
准确率
也称为正确率,即预测正确的样本占比,包括数据为阳预测为阳和数据为阴预测为阴的数据。即预测了这么多,有多少预测正确。
即 准确率 =(TP+TN)/ 总数据
精确率
预测为正类的数据中,预测对的占比。即预测为正数据也为正 / 所有预测为正的数据。即第一单元格数据 / 第一行数据
即 精确率 = TP / (TP+FP)
召回率
所有真实为正类的数据中,预测对的占比。 即预测为正数据也为正 / 所有真实的正类数据。即第一单元格数据 / 第一列数据
即 召回率 = TP / (TP+FN)