一、基本概念
TP:(true positive 正报) 正确预测---本是正类,预测为正类。
FP:(false positive 误报)错误预测---本是负类,却预测为正类。
FN:(false negative 漏报)错误预测---本是正类,却预测为负类。
TN:(true negative 正报) 正确预测---本是负类,预测为负类。
真正类率:TP/(TP+FN),即 实际为正类也被预测为正类 / 实际所有正类,做纵轴。
伪正类率:FP/(FP+TN),即 实际是负类却被预测为正类 / 实际所有负类,做横轴。
二、ROC空间
不同分类器在相同阈值时组成的离散点,用来评价分类器的优劣。
标准:离左上角越近的点预测(诊断)准确率越高。
三、ROC曲线
同一分类器取若干不同阈值时,所构成的曲线。
标准:
当阈值设定为最高时,必得出ROC座标系左下角的点 (0, 0)。(阈值最高,即没有任何值被判断为正类)
当阈值设定为最低时,必得出ROC座标系右上角的点 (1, 1)。(阈值最低,即所有值都被判断为正类)