ROC,AUC及其基于Sklearn的实现
ROC和AUC的概念
ROC的全称是Receiver Operating Characteristic Curve,中文名字叫“受试者工作特征曲线”,顾名思义,其主要的分析方法就是画这条特征曲线。
首先,对于二分类
预测结果 +1 | 预测结果 -1 | |
---|---|---|
真实结果 +1 | TP | FN |
真实结果 -1 | FP | TN |
该曲线的横坐标为假阳性率(False Positive Rate, FPR),N是真实负样本的个数,
FP是N个负样本中被分类器预测为正样本的个数,则 F P R = ( F P F P + T N ) FPR=\left(\frac{FP}{FP+TN}\right) FPR=(FP+TNFP)
纵坐标为真阳率, T P R = ( T P T P + F N ) TPR=\left(\frac{TP}{TP+FN}\right) TPR=(TP+FNTP).
ROC曲线的绘制
总的来说,在ROC曲线的定义中,有“as its discrimination threshold is varied.”这样一句话,而在本文最开始也提到了分类器的结果可以是“概率输出”ÿ