统计学习的基本概念

最新推荐文章于 2022-07-31 16:44:11 发布

green_master

最新推荐文章于 2022-07-31 16:44:11 发布

阅读量376

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/green_master/article/details/52490274

版权

机器学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

过拟合（over-fitting）：是指学习时选择的模型所包含的参数过多，以致于这一模型对已知数据预测较好，对未知数据预测很差的现象。可以说模型选择旨在避免过拟合，并提高模型的预测能力。

泛化能力(generalization ability):是指学习到的模型对未知数据的预测能力，是学习方法的重要性质。现实生活中常常采用测试误差来评价学习方法的泛化能力。

在模型选择的典型方法是正则化和交叉验证。

交叉验证（cross validation）：把给定的数据集进行切分，将切分的数据集组合为训练集和测试集，用训练集来训练模型，用测试集对模型进行评估。

（1）简单交叉验证：首先简单的将数据集分为两部分，一部分作为训练集，另一分部作为测试集（70%是训练集，30%是测试集），然后用训练集在各种条件下训练模型，从而得到不同的模型；在测试集上评价各个模型的测试误差，选出测试误差最小的模型；

（2）S折交叉验证：随机地将数据集切分为S个互不相交的大小相同的子集，然后利用S-1个子集训练模型，利用余下的子集测试模型；将这一过程对可能的S中选择重复进行，最后评选出S次平均测试误差最小的模型。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
统计学习的基本概念

过拟合（over-fitting）：是指学习时选择的模型所包含的参数过多，以致于这一模型对已知数据预测较好，对未知数据预测很差的现象。可以说模型选择旨在避免过拟合，并提高模型的预测能力。泛化能力(generalization ability):是指学习到的模型对未知数据的预测能力，是学习方法的重要性质。现实生活中常常采用测试误差来评价学习方法的泛化能力。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。