《机器学习by周志华》学习笔记-模型评估与选择-01减少误差的方法

本文详细介绍了机器学习中的模型评估与选择方法,包括如何处理过拟合和欠拟合,训练集与测试集的产生方法如留出法、交叉验证法和自助法,并探讨了调参的重要性和不同类型参数的选择。
摘要由CSDN通过智能技术生成

1、目标

训练过程中,努力使「经验误差(训练误差)」最小。

2、过拟合与欠拟合的解决思路

2.1、过拟合

无法彻底解决,只能「缓解」,过拟合是机器学习面临的关键障碍。

2.2、欠拟合

(1)在决策树学习中扩展分支

(2)在神经网络学习中增加训练轮数

(3)...

3、训练集与测试集的产生方法

3.1、留出法

将数据D划分为2个互斥的集合S和T。S作为训练集,另一个T作为测试集(至少含30个样例)。

常见的样本分配方案:是将大约2/3~4/5的样本用于训练,剩余样本用于测试。

注意:

(1)S和T中的样本类别比例需要一致。

(2)通过不同划分方式多次取平均值作为模型评估结果。

3.2、交叉验证法

又称“k倍交叉验证/k折交叉验证”,将样本数据集D中的m个样本划分k(k常用的取值为10、5、15...)个大小相似、数据分布一致(主要指正负样本的分布一致)且互斥的子集(D1、D2、...、Dk),k≦m。

D=D1 ∪ D2 ∪...∪ Dk(Di ∩ Dj=∅且i≠j且m≧k≧2)

每次用k-1个子集作为训练集,1个子集作为测试集。共k次交叉测试结果,取平均值。下图为k=10的时候,10折交叉验证示意图:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI酱的读书笔记

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值