统计学习导论(五)重抽样法-学习笔记


重抽样法:通过反复从训练集中抽取样本,对每一个样本用 同一种统计方法重新拟合
包括

  • 交叉验证:用于模型评价(估计该统计学习方法的测试误差),模型选择(选择合适的光滑度)
  • 自助法:测量准确度

1 交叉验证法(Cross Validation, CV)

在拟合过程中,保留训练集的一个子集,重新拟合,估计其测试误差。

1.1 验证集方法(Validation set approach)

方法原理:将观测数据分为训练集与验证集(保留集)。

  1. 拟合训练集
  2. 用拟合的模型预测验证集中的响应变量
  3. 得到测试误差(均方误差)

方法缺陷:
4. 测试错误率的波动会很大,取决于训练集与验证集的划分。
5. 只拟合了训练集,训练观测越少,统计方法的表现越差,导致验证集错误率被高估。

1.2 留一交叉验证法(leave-one-out-validation, LOOCV)

LOOCV原理:

  1. 将一个 ( x 1 , y 1 ) (x_{1},y_{1}) x1,y1作为验证集,剩余 n − 1 n-1 n1个数据为训练集。训练集拟合模型,根据 x 1 x_{1} x1用模型预测 y ^ 1 \hat{y}_{1} y^1,得到渐进无偏估计 M S E 1 = ( y 1 − y ^ 1 ) 2 MSE_{1}=(y_{1}-\hat{y}_{1})^2 MSE1=(y1y^1)2(高度波动性)。
  2. 将一个 ( x 2 , y 2 ) (x_{2},y_{2}) x2,y2作为验证集,剩余 n − 1 n-1
  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

鸭鸭鸭鸭鸭鸭

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值