统计学习导论（五）重抽样法-学习笔记

最新推荐文章于 2023-03-18 20:18:51 发布

鸭鸭鸭鸭鸭鸭

最新推荐文章于 2023-03-18 20:18:51 发布

阅读量1.3k

点赞数

分类专栏：统计学习导论文章标签：机器学习统计学统计模型 r语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_52547939/article/details/118400435

版权

重抽样法

1 交叉验证法（Cross Validation, CV）
2 自助法（Bootstrap）
3 R语言实现——重抽样技术

重抽样法：通过反复从训练集中抽取样本，对每一个样本用 同一种统计方法重新拟合
包括

交叉验证：用于模型评价（估计该统计学习方法的测试误差），模型选择（选择合适的光滑度）
自助法：测量准确度

1 交叉验证法（Cross Validation, CV）

在拟合过程中，保留训练集的一个子集，重新拟合，估计其测试误差。

1.1 验证集方法（Validation set approach）

方法原理：将观测数据分为训练集与验证集（保留集）。

拟合训练集
用拟合的模型预测验证集中的响应变量
得到测试误差（均方误差）

方法缺陷：
4. 测试错误率的波动会很大，取决于训练集与验证集的划分。
5. 只拟合了训练集，训练观测越少，统计方法的表现越差，导致验证集错误率被高估。

1.2 留一交叉验证法（leave-one-out-validation, LOOCV）

LOOCV原理：

将一个 $x_{1},y_{1}）$ 作为验证集，剩余 $n - 1$ 个数据为训练集。训练集拟合模型，根据 $x_{1}$ 用模型预测 $\hat{y}_{1}$ ，得到渐进无偏估计 $MSE_{1}=(y_{1}-\hat{y}_{1})^2$ （高度波动性）。
将一个 $x_{2},y_{2}）$ 作为验证集，剩余

最低0.47元/天解锁文章

鸭鸭鸭鸭鸭鸭

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
打赏
0
评论
统计学习导论（五）重抽样法-学习笔记

1 交叉验证法（Cross Validation, CV）1.1 验证集方法（Validation set approach）方法原理：把获得的观测数据随机分为两部分：一部分为训练集（通常为原始数据集的一半），另一部分为验证集，或者叫保留集。在训练集上拟合模型，用拟合的模型在验证集上计算响应变量的值，进而得到验证集错误率，即测试错误率。方法缺陷：测试错误率的波动会很大，这取决于哪部分数据在训练集中，哪部分数据在验证集中。在验证集方法中，只有一部分观测数据（没用到所有的数据）被用于拟合模型。由于训
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

鸭鸭鸭鸭鸭鸭 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。