交叉验证法和自助法的异同

LT_real

于 2023-09-15 15:38:09 发布

阅读量459

点赞数

文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_47814951/article/details/132901495

版权

简介

在机器学习中，我们使用随机采样方法，从数据集D划分训练集和测试（验证）集进行模型的选择，也就是人工智能中模型评估常用的三种方法：留出法、交叉验证法和自助法（其中留出法也叫简单的交叉验证法）。

本文则针对其中交叉验证法和自助法的异同进行探讨。

ps：本文主要为个人查询网络资料的总结，便于后续的学习过程，如有不妥，敬请指教。

交叉验证法

采用无放回的随机采样方式，从数据集D中抽出部分数据作为训练集T，另外一部分作为测试集T'，并重复若干次随即划分过程，以每次划分对应的测试评估的均值作为评估结果（交叉便体现在重复若干次随机划分过程中两个数据集间数据的交叉）。

自助法

采用有放回的随机抽样方法，在保持训练集T与数据集D规模一致的条件下，从数据集D中抽出有重复的数据作为训练集T，剩下没有被抽中的数据作为测试集T'。

回答

相同点：

交叉验证法和自助法都是随机采样法。它们作为人工智能中评估模型的方法，根据一定规则从数据集D中划分训练集和测试（验证）集，从而评价模型在数据集上的表现，便于我们选择合适的模型。

不同点：

正如上面所述，这两种方法最大的不同点在于每次划分过程中每个样本点是否只有一次被划入训练集或测试集的机会。下面将针对这方面详细展开论述：

交叉验证法采用的是无放回的随机采样方式，这种方式可以保持数据分布的一致性条件，并严格划分训练集与测试集的界限，从而增强测试评估的稳定性和可靠性。

自助法主要面向数据集同规模的划分问题。其采用的是有放回的随机抽样方法，可以使得得到的模型更为稳健，解决了交叉验证法中模型选择阶段和最终模型训练阶段的训练集规模差异问题；但训练集T和原始数据集D中数据的分布未必相一致，因此对一些对数据分布敏感的模型选择并不适用。

参考：

从k折到自助法：常用交叉验证方法的优缺点-阿里云开发者社区 (aliyun.com)

人工智能之模型评估的三种方法：留出法，交叉验证，自助法 - 哔哩哔哩 (bilibili.com)

交叉验证、留一交叉验证、自助法 - 简书 (jianshu.com)

数据挖掘(ISL)| 05-重抽样: 交叉验证与自助法 - 知乎 (zhihu.com)

博客等级

码龄5年

20
原创

177
点赞

227
收藏

111
粉丝

关注

私信

热门文章

最新评论

Quite-STaR论文阅读
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
新版本本地化的fastgpt接入重排模型≥4.8.20
LT_real: 是的，比如前面的嵌入模型m3e，我就加入了Fastgpt网络，可以通过m3e：6008访问服务；而对于重排模型，我没有加入fastgpt网络，则默认在bridge网络中，可以用docker network inspect bridge查看IP就是172.18.0.10，docker内部容器互相访问以这个IP为准
新版本本地化的fastgpt接入重排模型≥4.8.20
2301_78489226: 请教下，您在部署重排模型时，将重排模型加入Fastgpt的网络后，您在config文件中添加重排模型信息的时候，IP地址：172.18.0.10是宿主机的IP地址还是哪里的地址？我记得加入同一个网络后，是不是可以直接用容器名：ports这样子来设置。
rust实现大语言模型记录
LT_real: 你可以去Infinitensor开源社区官网看看，里面有课程视频和PPT，我也是在里面学的，可惜最近太忙了做不完orz。评论好像不能放链接，我更新到参考最后一条了。
rust实现大语言模型记录
喵来八荒2580: 大佬，能指个可以看的懂,有图能算多头注意力机制的资料吗？

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。