混淆矩阵
实际样本 | 预测结果 | |
正例 | 反例 | |
正例 | TP(正预测为正,真正) | FN(正预测为负,假负) |
负例 | FP(负预测为正,假正) | TN(负预测为负,真负) |
1.准确率
TP和TN:表示预测正确的
2.1. 查准率:(精确率),预测为真占预测为真的百分比,表示对正样本的预测准确程度(预测为正/所有为正的预测)。
2.2. 查全率:(召回率),实际样本为正中预测为正的比例,(预测为正/所有为正的样本)
2.3 F1, 兼顾精确率和召回率
3.1. 灵敏度,真正率(True Positive Rate , TPR),正样本预测正确的/正样本总数:
3.2.特异性,真假率(True Negative Rate , TNR),负样本预测正确的/负样本总数:
3.3. 假负率:(False Negative Rate , FNR),FNR=1-TPR, 正样本预测错误的/正样本总数。
3.4. 假正率: (False Positive Rate , FPR),FPR=1-TNR,负样本预测错误的/负样本总数。
灵敏度和特异度可以解决样本不平衡的问题,因为灵敏度只关注正样本检出率,特异度只关注负样本检出率。
3.5. ROC
纵坐标:真正率(灵敏度);
横坐标:假正率(1-特异性);
优势:
不受阈值选择影响;(ROC曲线各点是根据不同阈值绘制出的点)
正负样本不均匀不影响ROC评价;(灵敏度、特异度计算只分别关注正样本和负样本)
表示将pre递增排序后,正样本label对应的排序序号之和。