机器学习备忘录之模型评估

本文探讨了机器学习中的模型评估,重点介绍了度量指标如准确率、精确率、召回率及其应用场景,以及ROC曲线和AUC的概念。此外,还讨论了A/B测试的重要性以及模型评估方法如留出法、交叉验证和自助法。同时,提到了超参数调优和过拟合、欠拟合的问题及应对策略。
摘要由CSDN通过智能技术生成

度量指标

评估模型的好坏需要一个度量方法 ,选择不同的度量方法可能会导致最后对模型的选择不同。

准确率(Accuracy):分类正确的样本占总样本个数的比例。
精确率(Precision):分类正确的正样本个数占分类器判定为正样本个数的比例。
召回率(Recall):分类正确的正样本个数占真正的正样本个数的比例。

当不同类别的样本比例非常不均衡时,将准确率作为分类性能的指标非常局限,可以使用更加有效的平均准确率(每个类别下的样本准确率的算数平均)作为模型评估的指标。

精确率更为保守,在很有把握时才将样本预测为正样本,因此会漏掉很多正样本;召回率更为激进,与精确率相反。因此精确率、召回率两者矛盾又统一。通常要绘制P-R曲线,单个点对应的精确率和召回率并不能全面地衡量模型的性能,画曲线能对模型进行更为全面的评估。平衡点(BEP)、F1值(精确率和召回率的调和均值)、ROC曲线也能综合反映一个排序模型的性能。
在这里插入图片描述
ROC曲线的绘制:二值分类问题中,模型的输出一般都是预测样本为正例的概率,概率大于该值则判为正例,小于该值判为负例,计算FPR和TPR,形成ROC曲线上的一点。通过不断移动截断点,则可绘制出ROC曲线。
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值