ROC曲线与“代价曲线”（cost-curve）的探究（1）

最新推荐文章于 2023-12-31 01:49:02 发布

「已注销」

最新推荐文章于 2023-12-31 01:49:02 发布

阅读量2.3k

点赞数 3

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/xiaoyi1888/article/details/106818225

版权

本文深入探讨ROC曲线的基本性质，包括ROC曲线必经原点和(1,1)、上方曲线优于下方曲线等。此外，文章介绍了AUC的定义及其与分类器性能的关系，强调ROC曲线对样本分布的不敏感性。最后，文章指出ROC曲线的局限，并预告将讨论解决这些问题的代价曲线。" 126746099,9396188,HarmonyOS Service中使用Emitter传递数据,"['Harmonyos', '服务开发', '触发器', '数据通信']

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

引言

很多分类器是为测试样本产生一个实值或概率预测，然后将这个预测值与一个分类阈值进行比较，若大于阈值则分为正类，否则为负类。
在不同的应用任务中，根据实际需要，可以选择不同的阈值。如果我们更加重视“查准率(Precision Rate)”，那么可以将阈值选得较大；如果我们更重视“召回率(Recall Rate)”，那么可以将阈值选得较小。
当样本分布给定的时候，对于特定的阈值，我们都可以用该分类器进行测试，计算出真正例率(True Positive Rate，简称TPR， $TPR=\frac{TP}{TP+FN}$ )和假正例率(False Positive Rate，简称FPR， $FPR=\frac{FP}{TN+FP}$ )。如果连续地改变阈值，那么TPR和FPR就会构成一条二维曲线，这条曲线就称为ROC曲线(Receiver Operating Characteristic Curve)。