机器学习模型评估策略及相关术语

最新推荐文章于 2023-03-16 12:44:26 发布

大数据面壁者

最新推荐文章于 2023-03-16 12:44:26 发布

阅读量345

点赞数

分类专栏：机器学习与算法文章标签：算法机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42796403/article/details/113764260

版权

机器学习与算法专栏收录该内容

19 篇文章 2 订阅

订阅专栏

机器学习模型评估策略及相关术语

目录

机器学习模型评估策略及相关术语

1.模型评估

1.1 训练集和测试集

我们将数据输入到模型中训练出了对应模型，但是模型的效果好不好呢？我们需要对模型的好坏进行评估
我们将用来训练模型的数据称为训练集，将用来测试模型好坏的集合称为测试集。
训练集：输入到模型中对模型进行训练的数据集合。
测试集：模型训练完成后测试训练效果的数据集合。

1.2 损失函数

损失函数用来衡量模型预测误差的大小。
定义：选取模型 f 为决策函数，对于给定的输入参数 X，f(X) 为预测结果， Y 为真实结果；f(X) 和 Y 之间可能会有偏差，我们就用一个损失函数（loss function）来度量预测偏差的程度，记作 L(Y,f(X))
损失函数是系数的函数
损失函数值越小，模型就越好

0 – 1 损失函数

平方损失函数

绝对损失函数
```
  **对数损失函数**
```

在这里插入图片描述

1.3 训练误差和测试误差

训练误差

训练误差（training error）是关于训练集的平均损失。
训练误差的大小，可以用来判断给定问题是否容易学习，但本质上并不重要

测试误差

测试误差（testing error）是关于测试集的平均损失。
测试误差真正反映了模型对未知数据的预测能力，这种能力一般被称为 泛化能力

1.4 过拟合和欠拟合

模型没有很好地捕捉到数据特征，特征集过小，导致模型不能很好地拟合数据，称之为欠拟合（under-fitting）。欠拟合的本质是对数据的特征“学习”得不够
训练数据学习的太彻底，以至于把噪声数据的特征也学习到了，特征集过大，这样就会导致在后期测试的时候不能够很好地识别数据，即不能正确的分类，模型泛化能力太差，称之为过拟合（over-fitting）。

2.模型选择

当模型复杂度增大时，训练误差会逐渐减小并趋向于0；而测试误差会先减小，达到最小值之后再增大
当模型复杂度过大时，就会发生过拟合；所以模型复杂度应适当

2.1 正则化

结构风险最小化（Structural Risk Minimization，SRM）

是在 ERM 基础上，为了防止过拟合而提出来的策略
在经验风险上加上表示模型复杂度的正则化项（regularizer），或者叫惩罚项
正则化项一般是模型复杂度的单调递增函数，即模型越复杂，正则化值越大

结构风险最小化的典型实现是正则化（regularization）

形式：
第一项是经验风险，第二项 J (f ) 是正则化项，是调整两者关系的系数
正则化项可以取不同的形式，比如，特征向量的L1范数或L2范数

2.2 奥卡姆剃刀原则

奥卡姆剃刀(Occam‘s razor)原理：如无必要，勿增实体
正则化符合奥卡姆剃刀原理。它的思想是：在所有可能选择的模型中，我们应该选择能够很好地解释已知数据并且十分简单的模型
如果简单的模型已经够用，我们不应该一味地追求更小的训练误差，而把模型变得越来越复杂

3 交叉验证

3.1 数据集划分

如果样本数据充足，一种简单方法是随机将数据集切成三部分：训练集（training set）、验证集（validation set）和测试集（test set）
训练集用于训练模型，验证集用于模型选择，测试集用于学习方法评估

3.2 交叉验证

数据不充足时，可以重复地利用数据——交叉验证（cross validation）

简单交叉验证

数据随机分为两部分，如70%作为训练集，剩下30%作为测试集
训练集在不同的条件下（比如参数个数）训练模型，得到不同的模型
在测试集上评价各个模型的测试误差，选出最优模型

S折交叉验证

将数据随机切分为S个互不相交、相同大小的子集；S-1个做训练集，剩下一个做测试集
重复进行训练集、测试集的选取，有S种可能的选择

留一交叉验证

大数据面壁者

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
机器学习模型评估策略及相关术语

机器学习模型评估策略及相关术语目录机器学习模型评估策略及相关术语1.模型评估1.1 训练集和测试集1.2 损失函数1.3 训练误差和测试误差1.4 过拟合和欠拟合2.模型选择2.1 正则化2.2 奥卡姆剃刀原则3 交叉验证3.1 数据集划分3.2 交叉验证1.模型评估1.1 训练集和测试集我们将数据输入到模型中训练出了对应模型，但是模型的效果好不好呢？我们需要对模型的好坏进行评估我们将用来训练模型的数据称为训练集，将用来测试模型好坏的集合称为测试集。训练集：输入到模型中对模型进行训练的数据集合
复制链接

扫一扫

专栏目录

大数据面壁者 CSDN认证博客专家 CSDN认证企业博客

码龄6年

327: 原创

18万+: 周排名

217万+: 总排名

39万+: 访问

: 等级

4803: 积分

265: 粉丝

168: 获赞

136: 评论

1238: 收藏

私信

关注

热门文章

分类专栏

最新评论

log4j升级之路
CSDN-Ada助手: 非常感谢CSDN博主<您的博主名>，这篇博客“log4j升级之路”让我受益匪浅。我觉得您可以继续写一篇关于日志框架的博客，比如“logback使用指南”或“slf4j实践总结”，这样的技术文章对其他用户也会非常有帮助。下一篇您可以就<您的博客主题建议>继续写，相信会有更多读者受益。期待您的下一篇好文！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
Flink流处理查询外部数据源的解决方法
Jiec_2018: 没demo吗？
使用FlinkSQL将数据写入到ClickHouse
chaojiyuhao: 大佬flinkjar下不了可以更新一下吗
使用FlinkSQL将数据写入到ClickHouse
TUBER727: 大佬，可以分一下驱动jar包吗
使用FlinkSQL将数据写入到ClickHouse
机佬快跑: 你的flink是什么版本

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。