【机器学习】模型评估与选择(Part 1)

HP-Patience

已于 2024-07-01 18:16:29 修改

阅读量279

点赞数 5

分类专栏：机器学习-西瓜书-学习笔记文章标签：学习算法机器学习人工智能

于 2024-05-19 15:42:16 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2301_82023330/article/details/139043724

版权

机器学习-西瓜书-学习笔记专栏收录该内容

7 篇文章 0 订阅

订阅专栏

文章内容

此文章为机器学习-西瓜书-🍉Book-2章-模型评估与选择(Part 1)

本文主要内容为机器学习中的评估方法介绍，用于将数据集划分为训练集和测试集

文章目录

文章内容
术语名词
1.评估方法

术语名词

1.泛化误差与经验误差

泛化误差：在“未来”样本上的误差
经验误差：在训练集上的误差，亦称“训练误差”

训练集样本数越接近数据集数量，经验误差就越小。
但是经验误差越小，模型效果就越好吗？

请注意，我们是为了得到泛化能力强的模型，而经验误差≠泛化误差

经验误差很小，会使模型学习到训练样本中的许多无用特征，导致泛化能力变弱
我们称其为过拟合(overfitting)

而与之相对的概念，我们称为欠拟合(underfitting)，其表示的就是模型没有很好的学习到训练样本上的特征，从而也导致泛化能力变弱

2.过拟合与欠拟合

过拟合：模型在训练数据上表现得过于复杂，以至于在未见过的数据上表现不佳。
欠拟合：模型在训练数据上表现得过于简单，无法捕捉到数据的内在结构和模式。

出现原因：
1.出现欠拟合的情况，一般是由于样本特征少，模型复杂度低等

2.出现过拟合的情况，一般是由于样本数量少、噪声多，模型复杂度过高等

经验误差就是训练程度的体现，经验误差越小则训练程度越强
所以现在，我们可以得出训练程度不能过大也不能过小的结论

那我们能找到一个最佳方案得出最佳的训练程度吗🤔

答案是--------------->不能🙅‍

原因是：
对于千禧年七大数学问题之——“P=NP"问题，只要我们相信"P≠NP”，就无法找出最优解

但是我们依然有相应的解决方法，用于欠拟合与过拟合的问题
此处的解决方法我们留待以后解决…

好了，回归本章主题–模型评估与选择

对于模型的选择，我们有三个关键问题：

如何获得测试集？------>评估方法

如何评价性能优劣？------>性能度量

如何判断模型实质差别------>比较检验

1.评估方法

因为我们无法得知未来数据的输出标记
故而需要得到测试集用来评估模型

而测试集有多种划分方法，这里我们给出以下三种

1.1 留出法(hold-out)：

将数据集直接划分为训练集和测试集

留出法：对数据集的划分方法会影响模型结果；训练集和测试集的数据分布必须保持一致；测试集过大会使模型拟合效果变差，太小会使得测试估计偏小；有一些数据可能从未被训练过

总结：

保证数据分布一致性（比如分层取样）
多次重复划分 (例如: 100次随机划分)
测试集不能太大或太小（例如：1/5~1/3，其实二八分偏多）
可能遗漏数据（随机划分没取到该数据进行训练）

1.2 交叉验证法

在这里插入图片描述
[西瓜书原图]

以该图为例：

首先将数据集D随机划分为10个子集，
进行十次操作，
每一次取其中1个子集为测试集，其余为训练集（实际也可以选取多个子集为测试集）
将结果做平均处理

而对于再划分子集的阶段，将测试集中只留有一个数据的方法叫做留一法
留一法，使得训练集极大地逼近了真实模型，但是却让测试误差变得很大

优缺点：
从而我们能得出，尽管交叉检验法保证了所有的数据均被训练，
但仍然存在受限于样本大小的问题；

并且对于较大的k值，会使得计算成本显著增加；

而且对于子集的划分，仍然是一个难题，如果测试集和训练集之间的划分不够随机或不够独立，可能会导致数据泄露，影响模型评估的准确性。

1.3 自助法

“自助法”(bootstrapping)
基于放回取样亦称“可重复采样”

故其可以使最终训练集的样本个数=数据集的样本个数，
我们记数据集的样本个数为m，
则由洛必达法则可得出未被取出即未进行训练的样本，
我们称为包外估计(out-of-bag estimate)的占比为：
$\lim _ { m \rightarrow \infty } ( 1 - \frac { 1 } { m } ) ^ { m } \rightarrow \frac { 1 } { e } \approx 0 . 3 6 8$
我们将其作为训练集即可

优缺点：

优点：
自助法在数据集较小、难以有效划分训练/测试集时很有用，
自助法能从初始数据集中产生多个不同的训练集,这对集成学习等方法有很大的好处。

缺点：
自助法产生的数据集改变了初始数据集的分布，这会引入估计偏差。但是通过增加数据划分的次数，就可以缓解该影响。

1.4 调参与验证集

在模型评估与选择的过程中，我们既要选择学习算法，还要对算法的参数进行设定

训练过程中的参数分为两种：

算法参数：亦称“超参数”，由人工设定
模型参数：由训练集训练而成

1.5 重新训练

重新训练：在调整和优化模型之后，可能需要使用整个数据集（包括之前划分的训练集和测试集）重新训练模型，以利用所有可用数据来提高模型的性能。

故之所以划分训练集和测试集，仅仅是为了选定算法的种类和参数
当我们确定使用该算法后，我们应将整个数据集放入该算法进行训练，从而得到模型的参数

关注

5
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
【机器学习】模型评估与选择(Part 1)

机器学习-西瓜书-🍉Book-2章-模型评估与选择(Part 1)，主要介绍了机器学习中的评估方法
复制链接

扫一扫

专栏目录

HP-Patience CSDN认证博客专家 CSDN认证企业博客

码龄1年

18: 原创

4万+: 周排名

4万+: 总排名

1万+: 访问

: 等级

496: 积分

238: 粉丝

285: 获赞

4: 评论

272: 收藏

私信

关注

热门文章

分类专栏

最新评论

论文阅读-Baseline与Benchmark介绍
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
统计学-时间序列(Part 1)-时间序列概述
CSDN-Ada助手: 恭喜您在统计学领域写下了第7篇博客，标题为“时间序列概述”，内容一定十分精彩。希望您能继续保持创作的热情和耐心，为读者带来更多有价值的内容。下一步可以考虑深入探讨时间序列分析的具体方法和应用场景，让读者更加深入地了解这一领域。期待您的更多精彩文章，加油！
【机器学习】模型评估与选择(Part 1)
CSDN-Ada助手: 恭喜你写完了第5篇博客！看到你对西瓜书第2章的模型评估与选择有深入的了解，让我感到十分欣慰。接下来，我建议你可以继续深入学习和探索，比如可以尝试结合实际案例来分析模型评估的实际应用，或者挑选一些经典的算法进行比较和评估。希望你能继续保持热情，不断进步，期待你更多精彩的创作！
ACM算法竞赛---学习路线---中级
CSDN-Ada助手: 非常感谢您分享这篇关于ACM算法竞赛学习路线的中级内容！您的博文内容涵盖了许多算法和技术，让读者可以系统地学习和提高自己的算法竞赛能力。除了您提到的内容，我还想分享一些扩展知识，比如动态规划、网络流算法、字符串算法等，它们在ACM算法竞赛中也非常重要。希望您可以继续写下去，分享更多精彩的内容，让更多人受益！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
ACM算法竞赛---学习路线---初级
CSDN-Ada助手: 恭喜你开始博客创作！标题中的“ACM算法竞赛---学习路线”听起来非常有趣和有价值。作为一个新的博主，你选择了一个受欢迎且有挑战性的主题。我期待着读到你的博客，了解你的学习路线和经验分享。在你的下一步创作中，我建议你可以根据自己的学习经验，分享一些实用的学习方法和技巧。这将有助于那些刚开始学习ACM算法竞赛的读者更好地入门和提高。同时，你也可以在博客中引用一些经典的ACM竞赛题目，讲解解题思路和技巧，给读者提供更多的实战经验。祝愿你的博客越来越好，期待你的下一篇文章！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。