《机器学习》西瓜书学习笔记（Chapter 2）

最新推荐文章于 2023-01-24 12:59:06 发布

Xiao_yanling

最新推荐文章于 2023-01-24 12:59:06 发布

阅读量231

点赞数

文章标签：西瓜书学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Xiao_yanling/article/details/88992232

版权

1.过拟合-----欠拟合2.评估方法（1）数据集->训练集+测试集留出法：直接将数据集分为两个互斥的集合，其中一个集合作为训练集S，一个作为测试集T。注意：分层采样；若干次随机划分再取平均；常取约23\frac{2}{3}32~45\frac{4}{5}54的样本用于训练。交叉验证法：数据集D=D1∪D2∪...∪Dk,Di∩Dj=∅.D=D_1∪D_2∪...∪D_k,D_...

摘要由CSDN通过智能技术生成

1.过拟合-----欠拟合

2.评估方法

（1）数据集->训练集+测试集

留出法：直接将数据集分为两个互斥的集合，其中一个集合作为训练集S，一个作为测试集T。
注意：分层采样；若干次随机划分再取平均；常取约 $\frac{2}{3}$ ~ $\frac{4}{5}$ 的样本用于训练。

交叉验证法：数据集 $D=D_1∪D_2∪...∪D_k,D_i∩D_j=∅.$
每次选k-1个子集的并集作为训练集，剩下的做测试集=>可做k次训练，再将测试结果取均值。

自助法：
bootstrapping：再抽样。
m次再抽样，D->D’ : D’做训练集，D\D’做测试集。
适用：数据集较小，难以有效划分训练/测试集时。
缺：自助法产生的数据集改变了初始数据集的分布，会引入估计偏差。

2.调参和最终模型

调参：对每个参数选定一个范围和变化步长。
最终模型：在学习算法和参数配置已选定后，将数据集D重新训练模型=>要交给用户的最终模型。

3.性能度量

（1）回归任务（预测）常用均方误差：

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
《机器学习》西瓜书学习笔记（Chapter 2）

1.过拟合-----欠拟合2.评估方法（1）数据集->训练集+测试集留出法：直接将数据集分为两个互斥的集合，其中一个集合作为训练集S，一个作为测试集T。注意：分层采样；若干次随机划分再取平均；常取约23\frac{2}{3}32~45\frac{4}{5}54的样本用于训练。交叉验证法：数据集D=D1∪D2∪...∪Dk,Di∩Dj=∅.D=D_1∪D_2∪...∪D_k,D_...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。