周志华《机器学习》第二章模型评估与选择笔记及习题解答

最新推荐文章于 2023-02-14 17:39:02 发布

Tzero__

最新推荐文章于 2023-02-14 17:39:02 发布

阅读量2.9k

点赞数 2

分类专栏：机器学习文章标签：机器学习西瓜书周志华

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_32735511/article/details/89414573

版权

第二章模型评估与选择笔记

笔记
习题

笔记

经验误差与泛化误差

学习器在训练集上的误差称为“训练误差”或“经验误差”，在新样本上的误差称为“泛化误差”

过拟合

学习器把训练样本自身特点当做所有潜在样本都会具有一样的性质，导致泛化能力下降，这种现象叫做过拟合

评估法

留出法

用“分层抽样法”将数据集D划分为两个集合：训练集 $S$ ,测试集 $T$ ，并且 $S\bigcap$ $T$ = $\varnothing$ ，用 $S$ 训练出模型后，用 $T$ 评估其泛化误差。

交叉验证法

用“分层抽样法”将数据集D划分为K个集合，每次训练使用K-1个集合，用另外一个作为测试集，从而可以进行K次训练与测试，最终返回的是K次训练后的均值。

留一法

交叉验证法的特例，留一法将数据集D中的m个样本划分为m个集合，每次用m-1个样本(集合)去训练，1个样本(集合)去测试。训练结果较为准确，但开销较大。#### 自助法
将数据集D进行有放回取样m次，得到包含m个样本的数据集 $D^`$ ,未被取到的样本作为测试集。

性能度量

性能度量：衡量模型泛化能力的标准
在对比不同模型的能力时，使用不同的性能度量会导致不同的评判结果，这就意味着模型的“好坏”是相对的。什么样的模型是好的，不仅取决于算法和数据，还取决于需求。

给定数据集 $D=\{(x_1,y_1),(x_2,y_2)....(x_m,y_m)\}$ ，其中 $y_i$ 是 $x_i$ 真实标记。

回归任务最常用的性能度量是均方误差：
$E(f;D)=\frac{1}{m}\displaystyle\sum_{i=1}^m(f(x_i)-y_i)^2$

最低0.47元/天解锁文章

关注

2
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
周志华《机器学习》第二章模型评估与选择笔记及习题解答

第二章模型评估与选择笔记笔记经验误差与泛化误差过拟合评估法留出法交叉验证法留一法自助法性能度量笔记经验误差与泛化误差学习器在训练集上的误差称为“训练误差”或“经验误差”，在新样本上的误差称为“泛化误差”过拟合学习器把训练样本自身特点当做所有潜在样本都会具有一样的性质，导致泛化能力下降，这种现象叫做过拟合评估法留出法用“分层抽样法”将数据集D划分为两个集合：训练集SS...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。