机器学习中的模型评估方法

最新推荐文章于 2022-06-23 19:57:51 发布

Never-Giveup

最新推荐文章于 2022-06-23 19:57:51 发布

阅读量881

点赞数

分类专栏：机器学习文章标签：机器学习模型评估

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36653505/article/details/82717661

版权

在机器学习中，我们通常把样本分为训练集和测试集，训练集用于训练模型，测试集用于评估模型。在样本划分和模型验证的过程中，存在着不同的抽样方法和验证方法。

1. Holdout检验

Holdout检验是最简单也是最直接的验证方法，它将原始的样本集合随机划分成训练集和验证集两部分。比方说，对于一个点击率的预测模型，我们把样本按照70%~30%的比例分成两部分，70%的样本用于模型训练，30%的样本用于模型验证，包括绘制ROC曲线，计算精确率和召回率等指标来评估模型性能。

Holdout检验的缺点很明显，即在验证集上计算出来的最后评估指标与原始分组有很大关系。为了消除随机性，研究者们引入了“交叉验证”。

2. 交叉验证

k-fold交叉验证：首先将全部样本划分为k个大小相等的样本子集；依次遍历这k个子集，每次把当前子集作为验证集，其余所有子集作为训练集，进行模型的训练和评估。最后把k次评估指标的平均值作为最终的评估指标。在实际实验中，k经常取值为10，即10折交叉验证。10折交叉验证也是最常用的测试方法，将数据分成10份，轮流将其中9份作为训练数据，1份作为测试数据，进行实验。每次实验都会得到相应的正确率，10次结果的正确率平均值作为算法精度的估计，一般需要进行多次10折交叉验证（例如10次10折交叉验证）再求均值，作为算法正确性的评估。

留一验证： 每次留下1个样本作为验证集，其余所有样本作为测试集。样本总数为n，依次对n个样本进行遍历，进行n次验证，再将评估指标求平均值

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习中的模型评估方法

在机器学习中，我们通常把样本分为训练集和测试集，训练集用于训练模型，测试集用于评估模型。在样本划分和模型验证的过程中，存在着不同的抽样方法和验证方法。 1. Holdout检验Holdout检验是最简单也是最直接的验证方法，它将原始的样本集合随机划分成训练集和验证集两部分。比方说，对于一个点击率的预测模型，我们把样本按照70%~30%的比例分成两部分，70%的样本用于模型训练，30%的样本...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。