评估方法（交叉验证法、自助法、留出法）

最新推荐文章于 2025-02-20 16:22:22 发布

BlackEyes_SY

最新推荐文章于 2025-02-20 16:22:22 发布

阅读量1.1w

点赞数 12

分类专栏：机器学习文章标签：交叉验证留出法留一法 10折交叉验证自助法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011204487/article/details/105588852

版权

机器学习专栏收录该内容

23 篇文章

订阅专栏

文章目录

留出法 hold-out
交叉验证法 cross validation
- k折交叉验证
- 留一法 leave-one-out cross validation
自助法 bootstrapping

留出法 hold-out

留出法直接将数据集D划分为两个互斥的部分，其中一部分作为训练集S，另一部分用作测试集T。通常训练集和测试集的比例为70%：30%。同时，训练集测试集的划分有两个注意事项：

尽可能保持数据分布的一致性。避免因数据划分过程引入的额外偏差而对最终结果产生影响。在分类任务中，保留类别比例的采样方法称为“分层采样”（stratified sampling）。
采用若干次随机划分避免单次使用留出法的不稳定性。

交叉验证法 cross validation

k折交叉验证

交叉验证法先将数据集D划分为k个大小相似的互斥子集，每次采用k−1个子集的并集作为训练集，剩下的那个子集作为测试集。进行k次训练和测试，最终返回k个测试结果的均值。又称为“k折交叉验证”（k-fold cross validation）。
在这里插入图片描述

留一法 leave-one-out cross validation

留一法是k折交叉验证k=m（m为样本数）时候的特殊情况。即每次只留下一个样本做测试集，其它样本做训练集，需要训练k次，测试k次。留一法计算最繁琐，但样本利用率最高。因为计算开销较大，所以适合于小样本的情况。

优点：样本利用率高。
缺点：计算繁琐。

自助法 bootstrapping

自助法以自助采样为基础（有放回采样）。每次随机从D（样本数为m）中挑选一个样本，放入D′中，然后将样本放回D中，重复m次之后，得到了包含m个样本的数据集。
样本在m次采样中始终不被采到的概率是 $(1-\frac{1}{m})^{m}$ ，取极限得到 $lim_{m\rightarrow \infty }=(1-\frac{1}{m})^{m}=\frac{1}{e}=0.368$ 。即D约有36.8%的样本未出现在D′中。于是将D′用作训练集，D\D′用作测试集。这样，仍然使用m个训练样本，但约有1/3未出现在训练集中的样本被用作测试集。

优点：自助法在数据集较小、难以有效划分训练/测试集时很有用。
缺点：自助法改变了初始数据集的分布，这会引入估计偏差。

参考：
https://blog.csdn.net/pxhdky/article/details/85206705

博客等级

码龄12年

153
原创

320
点赞

1327
收藏

159
粉丝

关注

私信

热门文章

分类专栏

TF 1篇
深度学习 39篇
C++ 1篇
TTS 1篇
基金 1篇
目标检测 1篇
深度学习框架 1篇
机器学习 23篇
推荐系统 2篇
CV 4篇
python 17篇
pyspark 6篇
hive 4篇
linux 9篇
hadoop 2篇
docker 2篇
git
面试题 7篇
算法 11篇
leetcode 7篇
随笔 3篇
杂谈

展开全部收起

最新评论

为什么梯度的负方向是梯度下降最快的方向
DREAMING669: 棒
回归评价指标（MSE、RMSE、MAE、R-Squared、拟合优度）
秋风汩起: R²可能为负值？这写得太扯了吧
TensorFlow
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)使用更多的站内链接。
Anaconda 安装cv2
文崎不摘口罩: update all之后还是有PermissionError报错
决策树系列
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)使用更多的站内链接。

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。