性能度量
Precision、Recall、F1
准确率(查准率,查的准不准)、召回率(查全率,查的全不全)、F1
-
P-R曲线
Precision-Recall
-
绘制:(以二分类为例)按样本分类的置信度(概率)从大到小对样本进行排序,按此顺序逐个把样本作为正例进行预测,则每次可以得到当前的P、R值,以此绘制P-R曲线
-
性质
-
模型C的PR曲线完全被模型A包住,则说明模型A优于模型C
-
模型A与模型B的PR曲线交叉,则根据以下方式判断
-
PR曲线与坐标轴围成面积大小(不易判断)
-
平衡点(Break-Even Point,BEP):P=R时的坐标点。平衡点越大的模型可认为越优秀
-
-
P-R曲线对样本不均衡非常敏感
-
-
-
F1
F 1 = 2 ∗ P ∗ R P + R F1 = \frac{2*P*R}{P+R} F1=P+R2∗P∗R
-
F β F_β Fβ
F1的一般形式,能表达出对P/R的不同偏好
- β = 1 β = 1 β=1时退化为标准的F1; β > 1 β > 1 β>1时R有更大影响; β < 1 β < 1 β<1时,P有更大影响
F β = ( 1 + β 2 ) ∗ P ∗ R ( β 2 ∗ P ) + R , β > 0 F_β = \frac{(1+β^2)*P*R}{(β^2*P)+R},β>0 Fβ=(β2∗P)+R(1+β2)∗P∗R,β>0
ROC & AUC
Receiver Operating Characteristic & Area Under ROC Curve
T P R = T P T P + F N TPR = \frac{TP}{TP+FN} TPR=TP+FNTP
F P R = F P T N + F P FPR = \frac{FP}{TN+FP} FPR=TN+FPFP
-
绘制:与P-R曲线类似先对样本进行排序,然后分别把分类阈值设置成样本的预测概率值,即依次把每个样例划分为正例
-
注意:在上述绘制过程中, T P + F N TP+FN TP+FN与 F N + F P FN+FP FN+FP是不变的,改变的只有 T P TP TP与 F P FP FP,所以ROC曲线其实是折线图
-
TRICK:若当前样本本身是正例,则往上画 1 m + \frac{1}{m^+} m+1;反之,往右画 1 m − \frac{1}{m^-} m−1
-
-
性质
-
若一个学习器的ROC曲线被另一个学习器的曲线完全包含,则可断言后者的性能优于前者
-
若两曲线交叉,则根据与坐标轴围成的面积进行判断,即AUC(Area Under ROC Curve)
-
ROC曲线对样本不均衡不敏感
-