机器学习和统计里面的auc怎么理解?

转自: https://www.zhihu.com/question/39840928


作者:小小丘 (该作者对 auc的意义 讲得非常棒, 感谢付出)
链接:https://www.zhihu.com/question/39840928/answer/84906286
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

看到前面答主的答案,我表示很激动的想来一个简化的版本。
曾经面试的时候被问到过这么一个问题,怎么向一个没有任何计算机、数学、统计等基础的人介绍下什么是AUC,当时我败北了。不过后来我有一天顿悟了,为了检验我的顿悟是否有效,特此一答。
我给出的答案是 AUC是指 从一堆样本中随机抽一个,抽到正样本的概率 比 抽到负样本的概率 大的可能性。 其实这个解释百度下到处都是,我是看别人说的然后理解了。 (这里列出无数参考文献,请自行百度)
详细解释如下: 随机抽取一个样本, 对应每一潜在可能值X都对应有一个抽中的概率P。
按概率从高到矮排个降序, 对于正样本中概率最高的,排序为rank_1, 比它概率小的有M-1个正样本(M为正样本个数), (rank_1 - M) 个负样本。
正样本概率第二高的, 排序为rank_2, 比它概率小的有M-2个正样本,(rank_2 - M + 1) 个 负样本。
以此类推
正样本中概率最小的, 排序为rank_M,比它概率小的有0个正样本,rank_M - 1 个负样本。
总共有MxN个正负样本对(N为负样本个数)。把所有比较中 正样本概率大于负样本概率 的例子都算上, 得到公式(rank_1 - M + rank_2 - M + 1 .... + rank_M - 1) / (MxN) 就是正样本概率大于负样本概率的可能性了。 化简后(因为后面是个等差数列)得:
<img src="https://i-blog.csdnimg.cn/blog_migrate/779d8522f4ccd16deebcc80e529fcbe2.png" data-rawwidth="571" data-rawheight="113" class="origin_image zh-lightbox-thumb" width="571" data-original="https://pic3.zhimg.com/a84974778b7d3c1387971c181876c4e2_r.png">这就是传说中的AUC公式。这只是用于理解,具体计算时候需要考虑rank平列的情况 这就是传说中的AUC公式。这只是用于理解,具体计算时候需要考虑rank平列的情况

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值