通过ROC曲线能够有效评估算法的性能,默认情况下适用于二分类任务,在多分类任务中利用one vs rest方式计算各个类别的混淆矩阵,使用如下平均方式
-
macro
:分别求出每个类,再进行算术平均
优点:直观、易懂,并且方便实现
缺点:实际情况下可能不同类别拥有不同的重要性,宏平均会导致计算结果受不常用类别的影响 -
micro
:全局计算。将所有混淆矩阵累加在一起,然后计算TPR/FPR/AUC
参考:
-
https://scikit-learn.org/stable/modules/generated/sklearn.metrics.roc_auc_score.html#sklearn.metrics.roc_auc_score
-
https://blog.zhujian.life/posts/48526d13.html