本文记录了评估分类模型性能的常用指标ACC、AUC、ROC曲线的计算方法和代码。代码使用python实现。
简介
ACC(Accuracy)是模型的准确率,即模型正确预测的样本数占总样本数的比例。ACC 可以用来评估模型在整体上的分类效果,但它不能很好地反映模型在不同类别上的表现差异。
AUC(Area Under the Curve)是 ROC 曲线下的面积,可以用来评估模型在不同阈值下的分类效果。AUC 的取值范围在 0.5 到 1 之间,值越大表示模型性能越好。当 AUC = 0.5 时,表示模型预测效果与随机猜测一样;当 AUC = 1 时,表示模型完全正确地区分了正负样本。
ROC(Receiver Operating Characteristic)曲线是一种常用的评估分类模型性能的工具。ROC 曲线的横轴表示假正例率(False Positive Rate),即负样本被错误地预测为正样本的比例;纵轴表示真正例率(True Positive Rate),即正样本被正确地预测为正样本的比例。ROC 曲线越接近左上角,表示模型性能越好;曲线越接近对角线,则表示模型性能越差。
总之,ACC、AUC 和 ROC 都是用于评估分类模型性能的指标,不同的指标可以从不同的角度来评估模型的性能,使用时需要根据具体的问题和需求进行选择。