《机器学习by周志华》学习笔记-模型评估与选择-01减少误差的方法

AI酱的读书笔记

已于 2024-08-16 18:11:01 修改

阅读量811

点赞数 12

分类专栏：机器学习机器学习by周志华文章标签：机器学习学习笔记人工智能深度学习数学建模

于 2024-02-22 11:02:17 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/vanilla698/article/details/136207578

版权

本文详细介绍了机器学习中的模型评估与选择方法，包括如何处理过拟合和欠拟合，训练集与测试集的产生方法如留出法、交叉验证法和自助法，并探讨了调参的重要性和不同类型参数的选择。

摘要由CSDN通过智能技术生成

1、目标

训练过程中，努力使「经验误差（训练误差）」最小。

2、过拟合与欠拟合的解决思路

2.1、过拟合

无法彻底解决，只能「缓解」，过拟合是机器学习面临的关键障碍。

2.2、欠拟合

（1）在决策树学习中扩展分支

（2）在神经网络学习中增加训练轮数

（3）...

3、训练集与测试集的产生方法

3.1、留出法

将数据D划分为2个互斥的集合S和T。S作为训练集，另一个T作为测试集（至少含30个样例）。

常见的样本分配方案：是将大约2/3～4/5的样本用于训练，剩余样本用于测试。

注意：

（1）S和T中的样本类别比例需要一致。

（2）通过不同划分方式多次取平均值作为模型评估结果。

3.2、交叉验证法

又称“k倍交叉验证/k折交叉验证”，将样本数据集D中的m个样本划分k（k常用的取值为10、5、15...）个大小相似、数据分布一致（主要指正负样本的分布一致）且互斥的子集（D1、D2、...、Dk），k≦m。

D=D1 ∪ D2 ∪...∪ Dk（Di ∩ Dj=∅且i≠j且m≧k≧2）

每次用k-1个子集作为训练集，1个子集作为测试集。共k次交叉测试结果，取平均值。下图为k=10的时候，10折交叉验证示意图：

最低0.47元/天解锁文章

AI酱的读书笔记

关注

12
点赞
踩
8

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

AI酱的读书笔记 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。