机器学习模型效果评估指标与方法介绍

本文介绍了模型评估的重要性和常用方法,包括验证(Hold-Out)和交叉验证(Cross-Validation)。重点讲解了分类模型的评估指标,如混淆矩阵、增益和提升图、K-S图、ROC曲线和AUC,以及回归模型的评价标准如RMSE、RSE、MAE、RAE和决定系数等。这些指标帮助我们理解模型的性能并作出优化。
摘要由CSDN通过智能技术生成

模型评估是模型开发过程的不可或缺的一部分。它有助于发现表达数据的最佳模型和所选模型将来工作的性能如何。在数据挖掘中,使用训练集中的数据评估模型性能是不可接受的,因为这易于生成过于乐观和过拟合的模型。数据挖掘中有两种方法评估模型,验证(Hold-Out)和交叉验证(Cross-Validation)。为了避免过拟合,这两种方法都使用(模型没有遇到过的)测试集来评估模型性能。

一、验证(Hold-Out)

使用这种方法时,通常大的数据集会被随机分成三个子集:

  1. 训练集:用于构建预测模型。
  2. 验证集:用于评估训练阶段所得模型的性能。它为模型参数优化和选择最优模型提供了测试平台。不是所有模型算法都需要验证机。
  3. 测试集或之前未遇到的样本用于评估模型未来可能的性能。如果模型与训练集拟合的好于测试集,有可能是过拟合所致。

二、交叉验证(Cross-Validation)

当仅有有限数量的数据时,为了对模型性能进行无偏估计,我们可以使用k折交叉验证(k-fold cross-validation)。 使用这种方法时,数据被分成k份数目相等的子集。我们构建k次模型,每次留一个子集做测试集,其他用作训练集。如果k等于样本大小,这也被称之为留一验证(leave-one-out)。

三、分类模型评估

3.1混淆矩阵(Confusion Matrix)

混淆矩阵显示了分类模型相对数据的真实输出(目标值)的正确预测和不正确预测数目。矩阵为NxN,其中N为目标值(类)数目。这类模型的性能通常使用矩阵中的数据评估。下表为两个类别(阳性和阴性)的2x2混淆矩阵。
在这里插入图片描述
术语:

• 阳性 (P, positive)
• 阴性 (N, Negative)
• 真阳性 (TP, true
positive):正确的肯定。又称:命中 (hit)
• 真阴性 (TN, true negative):正确的否定。又称:正确拒绝
(correct rejection)
• 伪阳性 (FP, false positive):错误的肯定,又称:假警报 (false
alarm)、第二型错误
• 伪阴性 (FN, false negative):错误的否定,又称:未命中(miss)、第一型错误
• 灵敏度(sensitivity)或真阳性率(TPR, true positive rate): 又称:召回率(recall)、命中率
(hit rate) 在阳性值中实际被预测正确所占的比例。 TPR = TP / P = TP / (TP+FN)
• 伪阳性率(FPR,
false positive rate): 又称:错误命中率,假警报率 (false alarm rate) FPR = FP / N = FP / (FP + TN) = 1-SPC
• 特异度 (SPC, Specificity)或真阴性率(TNR, true
negative rate): 在阴性值中实现被预测正确所占的比例。 SPC = TN / N = TN / (FP+TN) = 1-FPR
• 假发现率 (FDR, false discovery rate): FDR = FP / (FP + TP) = 1-TPR
• 准确度
(ACC, accuracy): 预测正确的数占样本数的比例。 ACC = (TP + TN) / (P + N)
• 阳性预测值
(

  • 1
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

fantasticString

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值