西瓜书--第二章《模型评估与选择》

最新推荐文章于 2024-07-26 13:24:37 发布

仰望星空的小马可

最新推荐文章于 2024-07-26 13:24:37 发布

阅读量208

点赞数

分类专栏：机器学习文章标签：机器学习深度学习人工智能

本文链接：https://blog.csdn.net/weixin_40911578/article/details/124798685

版权

机器学习专栏收录该内容

5 篇文章 0 订阅

订阅专栏

2.1经验误差与过拟合

误差：我们把学习器的实际预测输出与样本的真实输出之间的差异称为“误差”（error）。
经验误差：学习器在训练集上的误差称为“训练误差”（training error）或“经验误差”（empirical error）。
泛化误差：器在新样本上的误差叫做**“泛化误差”（generalization error）。
过拟合：过拟合是指，学习器在学习训练样本时将训练样本学得“太好”了，以至于将训练样本自身的一些特点当做了所有潜在样本都会具有的一般性质，这样就会导致泛化能力下降，机器学习中称这种现象为“过拟合”（overfitting）

2.2 评估方法

使用一个“测试集”(testing set)来测试学习器对新样本的判别能力,然后以测试集上的“测试误差”(testing error)作为泛化误差的近似.通常我们假设测试样本也是从样本真实分布中独立同分布采样而得.但需注意的是,测试集应该尽可能与训练集互斥，即测试样本尽量不在训练集中出现、未在训练过程中使用过.
下面介绍几种常见的做法：

留出法（hold-out）：即直接将数据集D划分为两个互斥的集合，其中一个作为训练集S，另一个作为测试集T。但需要注意的是，训练/测试集的划分尽可能要保持数据分布的一致性，避免因数据划分过程引入额外的偏差而对最终结果产生影响。故常采用“分层抽样”（stratified sampling）即保留类别比例的采样方式进行采样（sampling）。（例如通过D进行分层采样而获得含70%样本的训练集S和含30%样本的测试集T，若D包含500个正例，500个反例，则分层采样得到的S应包含350个正例、350个反例，而T则包含150个整理和150个反例）。值得注意的是，在使用留出法时，由于分层方式的不同最终的估计结果也不同，故常采用若干次随机划分、重复进行实验评估后取平均值作为留出法的评估结果。通常将大约2/3~4/5的样本用于训练，剩余样本用于测试。一般而言，测试集至少应包含30个样例。
交叉验证法（cross validation）

在这里插入图片描述