数据挖掘之模型评估（AUC和F-measure）

最新推荐文章于 2024-08-19 00:09:01 发布

对面『胶己人』

最新推荐文章于 2024-08-19 00:09:01 发布

阅读量6.2k

点赞数 1

分类专栏：数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhougb3/article/details/80254309

版权

本文介绍了数据挖掘比赛中常用的评分标准，包括AUC和F1值的计算方法。AUC作为二分类模型评价指标，衡量模型区分正负样本的能力，不受阈值影响。F-measure基于精确率和召回率，比赛要求提交预测结果按风险可能性排序，以计算AUC和F1，从而评估模型性能。

摘要由CSDN通过智能技术生成

最近在打一个数据挖掘的比赛，看到评分标准如下：

按如下公式计算得分：
score=0.6×auc+0.4×F1
其中：
auc值为在测试集上，根据预测结果按照标准auc定义计算的分值；
F1值为针对测试集中实际标签为1（风险用户）的用户，根据预测结果，按照标准F-measure定义计算的分值。

对于一个刚接触数据挖掘的人来说，连评分规则都没看懂，GG了，于是果断查了下AUC的用法。

AUC是一个模型评价指标，只能用于二分类模型的评价。很多机器学习的模型对分类问题的预测结果都是概率，如果要计算accuracy，需要先把概率转化成类别。这就需要手动设置一个阈值，如果对一个样本的预测概率高于这个预测，就把这个样本放进一个类别里面。低于这个阈值，放进另一个类别里面。

AUC是指随机给定一个正样本和一个负样本，分类器输出该正样本为正的那个概率值比分类器输出该负样本为正的那个概率值要大的可能性。

对于一批已知正负的样本集合（M正N负），任取一个正样本和一个负样本，共有M*N种方法（事件集合，作为分母）。每次取一个正样本，通过我们的模型来计算他的概率值，再根据所有负样本的概率值，概率值低于正样本概率值的就是符合条件的（分子数值加1）。遍历完M个正样本的情况，得到的结果就是AUC值。

知乎上说，AUC方法可以避免将预测概率转换为类别。个人理解，在使用AUC评估模型的时候，使用的是概率值来评估模型而没有受到阀值的影响，这样对模型的评价可能

最低0.47元/天解锁文章

对面『胶己人』

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

对面『胶己人』 CSDN认证博客专家 CSDN认证企业博客

码龄8年

179: 原创

5万+: 周排名

230万+: 总排名

35万+: 访问

: 等级

4026: 积分

156: 粉丝

180: 获赞

23: 评论

895: 收藏

私信

关注

热门文章

分类专栏

最新评论

select用法&原理详解（源码剖析）
要啥昵称: 2）若fd＝5,执行FD_SET(fd,&set);后set变为0001,0000(第5位置为1)。【这里set应该变为00100000，是bit5置位】 3）若再加入fd＝2，fd=1,则set变为0001,0011【同理，变为00100110】 4）执行select(6,&set,0,0,0)阻塞等待【这里没有问题，但评论里有人说有问题，属于理解错误】 5）若fd=1,fd=2上都发生可读事件，则select返回，此时set变为0000,0011。注意：没有事件发生的fd=5被清空。【同理变为00000110，即谁有事件谁置位，入参和出参是两个完全独立的东西了】
select用法&原理详解（源码剖析）
Y_ontheway: 纠错一下，select用法第三点，写的时间是秒，毫秒，下面的结构体标注的是秒，微秒
select用法&原理详解（源码剖析）
leaveing: 一般0、1、2代表的是标准输入、标准输出标准出错，肯定是从0开始的。
RPC TAF（TARS）框架初学
Tisfy: 深得人心，正如古人云：马作的卢飞快，弓如霹雳弦惊。
Linux 中 ls 命令 -d -l 参数讲解
罗啰: 可能没装图形界面叭

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。