一、ROC曲线
(1)定义
ROC: 接收者操作特征(receiveroperating characteristic),roc曲线上每个点反映着对同一信号刺激的感受性。常用于二分类问题中的模型比较,主要表现为一种真正例率 (TPR) 和假正例率 (FPR) 的权衡。
横轴:负正类率(false postive rate FPR)特异度,划分实例中所有负例占所有负例的比例;(1-Specificity),FPR越大,预测正类中实际负类越多
纵轴:真正类率(true postive rate TPR)灵敏度,Sensitivity(正类覆盖率),TPR越大,预测正类中实际正类越多。
(2)分析
针对一个二分类问题,将实例分成正类(postive)或者负类(negative)。但是实际中分类时,会出现四种情况.
1、若一个实例是正类并且被预测为正类,即为真正类(True Postive TP)
2、若一个实例是正类,但是被预测成为负类,即为假负类(False Negative FN)
3、若一个实例是负类,但是被预测成为正类,即为假正类(False Postive FP)
4、若一个实例是负类,但是被预测成为负类,即为真负类(True Negative TN)
由上表可计算得到:
1、真正类率(True Postive Rate)TPR: TP/(TP&#