模型评估标准常用指标

最新推荐文章于 2024-06-05 17:35:25 发布

jumdar

最新推荐文章于 2024-06-05 17:35:25 发布

阅读量1.3w

点赞数 3

分类专栏：数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jumdar/article/details/85796618

版权

数据分析专栏收录该内容

6 篇文章 0 订阅

订阅专栏

一、分类指标

样本中存在两种两种标签：样本真实标签和模型预测标签。
根据这两个标签可以得到一个混淆矩阵：

每一行代表样本的真实类别，数据总数表示该类别的样本总数。
每一列代表样本的预测类别，数据总数表示该类别的样本总数。
分类模型的评价指标主要基于混淆矩阵。

二、混淆矩阵

三、正确率

用来表示模型预测正确的样本比例。
定义如下：

四、精度和召回率

精度和召回率是比正确率更好的性能评价指标，是对某个类别的评价。

精度：（查准率）是指正确预测的正样本占所有预测为正样本的比例：

召回率：（查全率）又称灵敏度和命中率，是指正样本中被正确预测的比例：

五、F1值

精度和召回率是负相关的：高精度往往对应召回率
F值即是综合考虑精度和召回率的一个指标：

其中为β正数，其作用是调整精度和召回率的权重。β越大，召回率的权重更大；β越小，则精度的权重更大。当β正数为1时为F1值，精度和召回率权值一样。

六、ROC与AUC

ROC曲线和AUC是一个从整体上评价二分类模型优劣的指标，其中AUC是ROC曲线与其横轴之间的面积。AUC值越大说明模型越好。
ROC曲线通过真阳率和假阳率两个指标进行绘制：

真阳率是真实标签为正样本里预测也为正样本的比例，用TPR表示
假阳率是真实标签为负样本里预测为正样本的比例，用FPR表示

关注

3
点赞
踩
35

收藏

觉得还不错? 一键收藏
0
评论
模型评估标准常用指标

一、分类指标样本中存在两种两种标签：样本真实标签和模型预测标签。根据这两个标签可以得到一个混淆矩阵：每一行代表样本的真实类别，数据总数表示该类别的样本总数。每一列代表样本的预测类别，数据总数表示该类别的样本总数。分类模型的评价指标主要基于混淆矩阵。二、混淆矩阵三、正确率用来表示模型预测正确的样本比例。定义如下：四、精度和召回率精度和召回率是比正确率更好...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。