统计机器学习笔记2——评价模型精度

本文介绍了统计机器学习中模型精度的评价方法,包括拟合效果检测、偏差-方差权衡以及分类模型的精度讨论。通过分析训练和测试均方误差,探讨了过拟合现象,以及如何平衡模型的偏差和方差。同时,文章提到了贝叶斯分类器和KNN分类器,并讨论了K值选择对KNN的影响。
摘要由CSDN通过智能技术生成

摘要

统计机器学习甚至是以前的课程中,会学习很多统计学习方法。不同的统计方法在不同的数据集上表现并不一样,老师强调说“在统计学中没有免费的午餐”,也就是说,没有任何一种方法在任何一个数据集中都比其它的方法好。在实践中,针对每一个数据集选择最好的方法非常重要。

评价模型精度

拟合效果检测

  • MSE(Mean Squared Error 残差均方误)
    回归问题中, M S E = 1 N ∑ i = 1 N ( y i − y ^ i ) 2 MSE=\frac{1}{N}\sum_{i=1}^{N}(y_i-\hat y_i)^2 MSE=N1i=1N(yiy^i)2
  • 测试、训练集
    训练数据就是用来拟合模型的。某些情况下,我们还能得到一组合适的测试数据,将由训练数据估计出的模型,来预测测试数据上的 X X X对应的 Y ^ \hat Y Y^,将其与测试数据上的真实 Y Y Y比较。计算得出测试均方误差。我们选择的模型应该要使测试均方误差尽可能小,这种方法大大避免了模型过拟合的现象。

一般情况下,测试数据不一定容易获取。我们将所有的观测值样本划分为训练集和测试集(打比方,就是我只用80%的数据当训练集,剩下的当测试集。当然划分方法有很多,后面会详细介绍),通过训练集来估计模型参数。一个模型的训练均方误最小时,不能保证模型的测试均方误最小。

  • 过拟合(Overfitting)
    当所建的模型产生一个较小的训练均方误差,但却有一个较大的测试均方误,就成该数据被过拟合。过拟合现象的存在意义是说明需要降低模型的光滑度,也就是复杂度(自由度)。

偏差-方差权衡(The Bias-Variance Trade-off)

除了MSE之外,还有两个指标影响我们对统计学习模型的选择:偏差和方差。
T e s t   M S E = A v e ( x i , y i ) ∈ t e s t ( y i − f ^ ( x i ) ) 2 Test ~MSE = Ave_{(x_i,y_i)\in test}(y_i-\hat f(x_i))^2 Test MSE=Ave(xi,yi)test(yif^(xi))2</

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值