一文详尽系列之模型评估指标

本文详细介绍了模型评估中的重要指标,包括准确率、精确率、召回率、F1值、P-R曲线、ROC曲线及其AUC。还讨论了MSE、RMSE和MAE在回归问题中的应用,以及如何处理离群点。此外,文章提到了离线评估的局限性和假设检验的方法,如T检验和Z检验,并展示了卡方检验在检验变量间关系中的应用。
摘要由CSDN通过智能技术生成

点击上方“Datawhale”,选择“星标”公众号

第一时间获取价值内容

在机器学习领域通常会根据实际的业务场景拟定相应的不同的业务指标,针对不同机器学习问题如回归、分类、排序,其评估指标也会不同。

准确率、精确率、召回率、F1值

定义
  • 准确率(Accuracy):正确分类的样本个数占总样本个数,
  • 精确率(Precision):预测正确的正例数据占预测为正例数据的比例,
  • 召回率(Recall):预测为正确的正例数据占实际为正例数据的比例,
  • F1 值(F1 score):
计算
背景:假如有 100 个广告,某用户对 80 个不感兴趣,对其中 20 个感兴趣,目标是找出所有用户感兴趣的广告,现在挑出 40 个,其中 10 个感兴趣的,请问如何评估一下他的工作。

实际正类 实际负类
预测正类
TP=10
FP=30
预测负类
FN=10
TN=50
通过混淆矩阵,我们可以算出来 
优缺点
准确率、精确率、召回率、F1 值主要用于分类场景。
准确率可以理解为预测正确的概率,其缺陷在于:当正负样本比例非常不均衡时,占比大的类别会影响准确率。如异常点检测时:99.9% 的都是非异常点,那我们把所有样本都视为非异常点准确率就会非常高了。
精确率可以理解为预测出的东西有多少是用户感兴趣的,召回率可以理解为用户感兴趣的东西有多少被预测出来了。一般来说精确率和召回率是一对矛盾的度量。为了更好的表征学习器在精确率和召回率的性能度量,我们引入 F1 值。
在个别领域可能我们对精确率和召回率的偏重不同,故我们引入  ,来表达出对精确率和召回率的不同偏好。
 时精确率影响力更大,
  • 4
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值