[学渣啃西瓜书]第二章：模型评估与选择-模型评估ROC和AUC

最新推荐文章于 2023-04-07 11:29:25 发布

Rookie_Codeman

最新推荐文章于 2023-04-07 11:29:25 发布

阅读量403

点赞数

分类专栏：基础学习文章标签：概率论

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_41939407/article/details/120845428

版权

用性能度量（performance measure）来评估学习器（模型）的泛化能力。但是不同的性能度量会对不同的模型有不一样的评判结果。好坏取决于任务需求。

公式方面我就不一一列举了，本文主要学习一下ROC和AUC，并通过一个案例实际绘制一个ROC和AUC。

从案例入手：

这是根据logistic回归做的二分类模型。其中红色的表示没有肥胖症的老鼠，蓝色代表有肥胖症的老鼠。横坐标是体重。此时我们已经有个这些老鼠和其属性值（体重）。

已经根据现有数据D给出模型，纵坐标是患有肥胖症的可能性[0, 1]。但我们并不想知道可能性，我们想要一个判断，即某老鼠是否有病。所以我们通过设置阈值进行判断。

上图设置阈值为0.5，如果体重相应的百分比大于0.5，即有病，反之则无。

我们在测试集中发现，有的分类正确，有的分类错误。如上图。蓝色点是有病的，左边第一个蓝点被错误分类，右边三个蓝点的分类正确；同理，左边三个红点被正确分类，右起第一个红点被错误分类。此时我们引入confusion martix（混淆矩阵）进行分析。

混淆矩阵 1

上面的混淆矩阵是根据阈值在0.5的情况下的分类情况。

1- 真正例True Positive/真阳（预测正，实际正） = 3 （左上）

2- 假正例False Positive/假阳（预测反，实际正） = 1 （右上）

3- 真反例True Negative/真阴（预测反，实际反） = 3 （右下）

4- 假反例False Negative/假阴（预测反，实际正）= 1 （左下）

关于阈值的设定：阈值设定代表了我们对业务的需求，如果我们想要不放过任何一个得病

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
[学渣啃西瓜书]第二章：模型评估与选择-模型评估ROC和AUC

用性能度量（performance measure）来评估学习器（模型）的泛化能力。但是不同的性能度量会对不同的模型有不一样的评判结果。好坏取决于任务需求。给定样本集 D = {(x1,y1),(x2,y2)...,(xm,ym)}, yi是xi的真实标记. f的性能是把f(x)和y进行比较。回归任务的性能度量是均方误差 E(f; D)概率密度均方误差 E（f;D）...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。