- TP(True Positive):将正类预测为正类数,真实为0,预测也为0
- FN(False Negative):将正类预测为负类数,真实为0,预测为1
- FP(False Positive):将负类预测为正类数, 真实为1,预测为0
- TN(True Negative):将负类预测为负类数,真实为1,预测也为1
ROC曲线计算:
- TPR: 在所有实际为阳性的样本中,被正确地判断为阳性之比率
TPR = TP/P = TP/(TP+FN)
- FPR: 在所有实际为阴性的样本中,被错误地判定为阳性之比率
FPR = FP/N = FP/(FP + TN)
FPR是横坐标,TPR是纵坐标。AUC就是ROC曲线下方面积
Precision(精确度)计算:TP/(TP+FP)
Recall(召回率)计算:TP/(TP+FN)
F1 计算:2*Precision*Recall/(Precision+Recall)
Precision体现了模型对负样本的区分能力,Precision越高,模型对负样本的区分能力越强;Recall体现了模型对正样本的识别能力,Recall越高,模型对正样本的识别能力越强。F1 score是两者的综合,F1 score越高,说明模型越稳健。
PR曲线:纵坐标是precision,横坐标哦是recall,精准率和召回率是相互制约的,如果想要精准率提高,召回率则会下降,如果要召回率提高,精准率则会下降,我们需要找到二者之间的一个平衡。