为什么用ROC与AUC评价分类器

ROC曲线和AUC是评估二分类模型性能的重要工具,尤其在处理样本分布不均衡的问题时。ROC曲线保持不变性,即使正负样本比例变化,而AUC是ROC曲线下的面积,表示模型的分类能力。较高的AUC值意味着更好的分类性能。ROC曲线的四个关键点分别代表了完美、最差、全预测为负和全预测为正的分类情况。
摘要由CSDN通过智能技术生成

模型有很多评估方法,为什么还要使用ROC和AUC呢? 因为ROC曲线有个很好的特性:当测试集中的正负样本的分布变换的时候,ROC曲线能够保持不变。在实际的数据集中经常会出现样本类不平衡,即正负样本比例差距较大,而且测试数据中的正负样本也可能随着时间变化。

 

ROC全称是“受试者工作特征”(Receiver Operating Characteristic)。

ROC曲线的面积就是AUC(Area Under the Curve)。

AUC用于衡量“二分类问题”机器学习算法性能(泛化能力)。

ROC曲线,通过将连续变量设定出多个不同的临界值,从而计算出一系列真正率和假正率,再以假正率为纵坐标、真正率为横坐标绘制成曲线,曲线下面积越大,诊断准确性越高。在ROC曲线上,最靠近坐标图左上方的点为假正率和真正率均较高的临界值。

对于分类器,或者说分类算法,评价指标主要有precision,recall,F-score。下图是一个ROC曲线的示例。

 

ROC曲线的横坐标为false positive rate(FPR),纵坐标为true positive rate(TPR)。其中 TODO, TODO, 下面着重介绍ROC曲线图中的四个点和一条线。 第一个点,(0,1),即FPR=0, TPR=1,这意味着FN(false

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值