机器学习模型评估方法介绍

1.基本概念介绍:


1.1经验误差与泛化误差


通常把分类错误的样本数占样本总数的比例称为错误率(error rate),即如果在m个样本中有a个样本分类错误,则错误率为E=a/m。相应地,1-a/m称为精度(accuracy),而把学习器的实际预测输出与样本的真实输出之间的差异称为误差(error)。学习器在训练集上的误差称为“训练误差(training error)”或“经验误差(empirical error)”,在新样本上的误差称为“泛化误差(generalization error)”。显然,我们希望得到泛化误差小的学习器,然而在事先不知道新样本是什么的情况下,实际能做的是努力使经验误差最小化。

1.2过拟合和欠拟合


(1)过拟合:最常见的过拟合情况是学习器的学习能力过于强大,以至于把训练样本所包含的不太一般的特性都学到了。
(2)欠拟合:通常是由学习能力低下造成的。可以通过在决策树学习中扩展分支、在神经网络学习中增加训练轮数等来克服。

2.评估方法


2.1 留出法


2.2 交叉验证法


2.3 自助法


3.性能度量


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值