模型评估与选择

最新推荐文章于 2023-11-14 16:16:40 发布

子衿_青青

最新推荐文章于 2023-11-14 16:16:40 发布

阅读量965

点赞数

分类专栏：西瓜书文章标签：模型选择查准率查全率

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_18433441/article/details/76188978

版权

本文介绍了模型评估的关键概念，包括过拟合和欠拟合的原因及其影响。讨论了经验误差和泛化误差，提出测试集、交叉验证和自助法等评估方法。此外，还详细讲解了查准率、查全率以及它们在不同场景下的重要性，并引入了代价敏感错误率和ROC曲线等相关概念。

摘要由CSDN通过智能技术生成

一、经验误差与过拟合

1）错误率：分类错误的样本数占样本总数的比例

2）精度：精度 = 1 一错误率

3）误差：学习器的实际预测输出与样本的真实输出之间的差异

4）训练误差/经验误差：学习器在训练集上的误差

5）泛化误差：学习器在新样本上的误差

6）过拟合：当学习器把训练样本学得"太好"了的时候，很可能巳经把训练样本自身的一些特点当作了所有潜在样本都
会具有的一般性质，这样就会导致泛化性能下降。这种现象称为过拟合

其中最常见的情况是由于学习能力过于强大，以至于把训练样本所包含的不太一般的特性都学到了

6.2）过拟合为什么无法避免

机器学习面临的问题通常是NP 难甚至更难，而有效的学习算法必然是在多项式时间内运行完成，若可彻底避免过拟合，则通过经验误差最小化就能获最优解，这就意味着我们构造性地证明了" P=NP" ;因此只要相信"p ≠NP " ，过拟合就不可避免

7）欠拟合：是指对训练样本的一般性质尚未学好。。通常是由于学习能力低下而造成的

二、模型评估的方法

1）不同的模型：不同的算法；相同的算法，但是不同的参数配置

2）理想的模型选择方案：

对候选模型的泛化误差进行评估，然后选择泛化误差最小的那个模型。。缺陷是没有新样本，无法直接获得泛化误差

3）测试集：从样本中划分出训练集和测试集，以测试误差来近似泛化误差

测试集的划分：（终究是对数据的完整性有影响，要找的潜在规律可能也被影响）

3.1）留出法（hold-out）

直接将数据集D 划分为两个互斥的集合，一个用来训练模型，一个评估

需要注意：

3.1.1）划分比例：大约2/3 到 4/5 的样本用于训练，剩余样本用于测试.

3.1.1）最好分层抽样，也就是训练/测试集的划分要尽可能保持数据分布的一致性

3.1.2）划分的问题，哪些进入训练集，哪些进入测试集，随机还是什么？所以往往需要多次随机划分，评估结果取平均值

3.2）交叉验证法（cross validation）

先将数据集D 划分为k 个大小相似的互斥子集，每次用k-1 个子集的并集作为训练集，余下的那个子集作为测试集;这样就可获得k组训练/测试集。。k次评估结果取平均值

3.2.1）将数据集D 划分为k 个子集同样存在多种划分方式.为减小因样本划分不同而引入的

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
模型评估与选择

一、经验误差与过拟合1）错误率：分类错误的样本数占样本总数的比例2）精度：精度 = 1 一错误率3）误差：学习器的实际预测输出与样本的真实输出之间的差异4）训练误差/经验误差：学习器在训练集上的误差5）泛化误差：学习器在新样本上的误差6）过拟合：当学习器把训练样本学得"太好"了的时候，很可能巳经把训练样本自身的一些特点当作了所有潜在样本都会具有的一般性质，这样
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。