定义
ROC曲线的X轴为FPR,Y轴为TPR
术语
- 阳性 (P, positive)
- 阴性 (N, Negative)
- 真阳性 (TP, true positive) 正确的肯定。又称:命中 (hit)
- 真阴性 (TN, true negative) 正确的否定。又称:正确拒绝 (correct rejection)
- 伪阳性 (FP, false positive) 错误的肯定,又称:假警报 (false alarm),第一型错误
- 伪阴性 (FN, false negative) 错误的否定,又称:未命中 (miss),第二型错误
- 真阳性率 (TPR, true positive rate) 又称:命中率 (hit rate)、敏感度(sensitivity)
TPR = TP / P = TP / (TP+FN) - 伪阳性率(FPR, false positive rate) 又称:错误命中率,假警报率 (false alarm rate) FPR = FP / N = FP / (FP + TN)
- 准确度 (ACC, accuracy) ACC = (TP + TN) / (P + N) 即:(真阳性+真阴性) / 总样本数
- 真阴性率 (TNR) 又称:特异度 (SPC, specificity) SPC = TN / N = TN / (FP + TN) = 1 - FPR
- 阳性预测值 (PPV) PPV = TP / (TP + FP)
- 阴性预测值 (NPV) NPV = TN / (TN + FN) 假发现率 (FDR) FDR = FP / (FP + TP
示例
from sklearn.metrics import roc_curve,auc
from sklearn.metrics import roc_auc_score
import matplotlib.pyplot as plt
def plot_figure(fpr, tpr):
roc_auc = auc(fpr, tpr) # 求auc面积
plt.plot([0, 1], [0, 1], 'k--')
plt.axis([0, 1, 0, 1])
plt.xlabel('FPR', fontsize=16)
plt.ylabel('TPR', fontsize=16)
plt.plot(fpr, tpr, label='ROC (area = {0:.6f})'.format(roc_auc), lw=2) # 画出当前分割数据的ROC曲线
print(roc_auc)
plt.legend(loc="lower right")
plt.show()
def fpr_tpr(predict,target):
TP = 0
FN = 0
FP = 0
TN = 0
fpr = []
tpr = []
for i in range(len(predict)):
if target[i] == 1 and predict[i] == 1:
TP += 1
elif target[i] == 1 and predict[i] == 0:
FN += 1
elif target[i] == 0 and predict[i] == 0:
TN += 1
else:
FP += 1
if TP + FN == 0:
tpr.append(0)
else:
tpr.append(TP/(TP + FN))
if FP + TN == 0:
fpr.append(0)
else:
fpr.append(FP/(FP + TN))
print('fpr',len(fpr))
fpr = sorted(fpr,reverse=False)
tpr = sorted(tpr,reverse=False)
return fpr,tpr
fpr,tpr = fpr_tpr(predict,target) ## 输入预测值和真实值,适用于预测值为二分类的数据
plot_figure(fpr,tpr)