数据挖掘实战(四)—模型评估

模型评估主要分为离线评估和在线评估两个阶段。针对分类、排序、回归、 序列预测等不同类型的机器学习问题,评估指标的选择也有所不同。本文介绍几种主流的评估指标。

  1. 准确率
    准确率是最简单的指标,即分类正确的个数与总样本数之比。
    在这里插入图片描述
    但是当样本不平衡时,该指标具有明显的局限性。如:正样本占99%,负样本占1%,即使瞎猜把所有测试集预测为正,准确率也有99%,看起来准确率很高,然而模型没有什么意义。
from sklearn.metrics import accuracy_score
xgb1.fit(X_train,y_train)
y_pred = xgb1.predict(X_test)
predictions=[round(value) for value in y_pred]
test_accuracy=accuracy_score(y_test,predictions)
  1. 精确率和召回率
    针对准确率的缺陷,引入了精确率和召回率(也称查准率和查全率)。
    精确率是指分类正确的正样本个数占分类器判定为正样本的样本个数的比例。召回率是指分类正 确的正样本个数占真正的正样本个数的比例。
    在这里插入图片描述
    在排序问题中,通常没有一个确定的阈值把得到的结果直接判定为正样本或 负样本,而是采用Top N返回结果的Precision值和Recall值来衡量排序模型的性能,即认为模型返回的Top N的结果就是模型判定的正样本,然
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值