机器学习---模型选择---偏差和方差

最新推荐文章于 2024-07-22 09:16:52 发布

哈尔滨张谦蛋

最新推荐文章于 2024-07-22 09:16:52 发布

阅读量173

点赞数 5

分类专栏：机器学习-point 文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_46521375/article/details/134395556

版权

机器学习-point 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

模型选择-偏差和方差

模型选择
拟合能力强的模型一般复杂度会比较高，容易过拟合。
如果限制模型复杂度，降低拟合能力，可能会欠拟合。
偏差与方差分解
期望错误可以分解为

以回归模型为例，假设样本的真实分布为𝑝𝑟(𝒙, 𝑦)，并采用平方损失函数，模型𝑓(𝒙)的期望错误为

ℛ(𝑓) = 𝔼(𝒙,𝑦)∼𝑝𝑟(𝒙,𝑦)[(𝑦 − 𝑓(𝒙))2].

最优模型为

𝑓∗(𝒙) = 𝔼𝑦∼𝑝𝑟(𝑦|𝒙)[𝑦]

其中 𝑝𝑟(𝑦|𝒙) 为样本的真实条件分布，𝑓∗(𝒙) 为使用平方损失作为优化目标的最优模型，其损失为

𝜖 = 𝔼(𝒙,𝑦)∼𝑝𝑟(𝒙,𝑦)[(𝑦 − 𝑓∗(𝒙))2].

损失𝜖通常是由于样本分布以及噪声引起的，无法通过优化模型来减少

期望错误可以理解为

ℛ(𝑓) = 𝔼(𝒙,𝑦)∼𝑝𝑟(𝒙,𝑦)[(𝑦 − 𝑓∗(𝒙) + 𝑓∗(𝒙) − 𝑓(𝒙))2]

=𝔼𝒙∼𝑝𝑟(𝒙)[(𝑓(𝒙) − 𝑓∗(𝒙))2]+ 𝔼(𝒙,𝑦)∼𝑝𝑟(𝒙,𝑦)[(𝑦 − 𝑓∗(𝒙))2]+ 2𝔼𝒙𝔼𝑦[𝑦 − 𝑓∗(𝒙)]

其中 ( 𝔼𝒙𝔼𝑦[𝑦 − 𝑓∗(𝒙)] = 0)

则 ℛ(𝑓)= 𝔼𝒙∼𝑝𝑟(𝒙)[(𝑓(𝒙) − 𝑓∗(𝒙))2]+ 𝔼(𝒙,𝑦)∼𝑝𝑟(𝒙,𝑦)[(𝑦 − 𝑓∗(𝒙))2]

= 𝔼𝒙∼𝑝𝑟(𝒙)[(𝑓(𝒙) − 𝑓∗(𝒙))2]+ 𝜖

𝔼𝒙∼𝑝𝑟(𝒙)[(𝑓(𝒙) − 𝑓∗(𝒙))2]是当前模型和最优模型之间的差距，是机器学习算法可以优化的真实目标。

标．在实际训练一个模型 𝑓(𝒙) 时，训练集 𝒟 是从真实分布 𝑝𝑟(𝒙, 𝑦) 上独立同分采样出来的有限样本集合．不同的训练集会得到不同的模型．令 𝑓𝒟(𝒙) 表示在训练集𝒟 上学习到的模型，一个机器学习算法（包括模型以及优化算法）的能力可以用不同训练集上的模型的平均性能来评价．

对于单个样本 𝒙，不同训练集 𝒟 得到模型 𝑓𝒟(𝒙) 和最优模型 𝑓∗(𝒙) 的期望差距为

则

ℛ(𝑓) = 𝔼𝒙∼𝑝𝑟(𝒙)[𝔼𝒟[(𝑓𝒟(𝒙) − 𝑓∗(𝒙))2]] + 𝜖,

= (bias)2 + variance + 𝜖

其中

(bias)2 = 𝔼𝒙[(𝔼𝒟[𝑓𝒟(𝒙)] − 𝑓∗(𝒙))2],

variance = 𝔼𝒙[𝔼𝒟[(𝑓𝒟(𝒙) − 𝔼𝒟[𝑓𝒟(𝒙)])2]]

模型选择：偏差与方差

Q:模型方差和噪声曲线的交点与偏差的最低点为什么不是同一坐标？

AN：

在模型复杂度和性能之间的折中中，我们通常关注的是偏差-方差权衡。这个折中体现在模型方差和噪声曲线的交点和偏差的最低点并不一定出现在同一模型复杂度上。这是因为偏差和方差的总体性质导致了这种不同。

1. 模型方差和噪声曲线的交点：

- **模型方差**：模型方差衡量的是模型在不同的训练数据集上预测的变化程度。高方差可能表示模型对训练数据集中的噪声过度敏感，导致在不同数据集上的性能差异较大。

- **噪声曲线**：噪声曲线表示了一个理想模型在真实数据上的性能，即在没有噪声的理想情况下，模型的性能。这条曲线是固定的，因为噪声是由数据的本质所决定的。

当模型方差等于噪声时，模型已经达到了其性能的上限，不再过拟合或欠拟合。在这一点上，我们认为模型已经足够复杂，能够很好地适应数据的噪声。

2. 偏差的最低点：

- **偏差**：偏差衡量的是模型的预测值与真实值之间的差异。它表示了模型对问题的简单性的偏好，即模型对数据的过度简化或过度复杂化。

在偏差的最低点，模型足够复杂以捕捉数据的关键特征，但仍然足够简单，不至于过度拟合。这是一个权衡，不同的问题可能需要不同的模型复杂度。

关系：

- 通常情况下，模型方差和噪声曲线的交点标志着模型在训练集和测试集上的性能都较好，但这并不一定是偏差的最低点。在偏差的最低点，模型更倾向于找到一个适当的复杂度，即在保持对训练数据的适应性的同时，不过分复杂，从而在测试数据上表现良好。

- 偏差-方差权衡意味着我们需要在模型过于简单（高偏差）和模型过于复杂（高方差）之间找到一种平衡。这种平衡不一定会与模型方差和噪声曲线的交点重合。

哈尔滨张谦蛋

关注

5
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
机器学习---模型选择---偏差和方差

标．在实际训练一个模型 𝑓(𝒙) 时，训练集 𝒟 是从真实分布 𝑝𝑟(𝒙, 𝑦) 上独立同分采样出来的有限样本集合．不同的训练集会得到不同的模型．令 𝑓𝒟(𝒙) 表示在训练集𝒟 上学习到的模型，一个机器学习算法（包括模型以及优化算法）的能力可以用不同训练集上的模型的平均性能来评价．。则 ℛ(𝑓)= 𝔼𝒙∼𝑝𝑟(𝒙)[(𝑓(𝒙) − 𝑓∗(𝒙))2]+ 𝔼(𝒙,𝑦)∼𝑝𝑟(𝒙,𝑦)[(𝑦 − 𝑓∗(𝒙))2]：模型方差衡量的是模型在不同的训练数据集上预测的变化程度。
复制链接

扫一扫

专栏目录

哈尔滨张谦蛋 CSDN认证博客专家 CSDN认证企业博客

码龄4年

46: 原创

1万+: 周排名

16万+: 总排名

3万+: 访问

: 等级

801: 积分

2234: 粉丝

333: 获赞

18: 评论

322: 收藏

私信

关注

热门文章

分类专栏

最新评论

微表情检测（三）----基于光流特征的微表情检测
哈尔滨张谦蛋: 基于光流的源码有很多的大部分文章都有开源，只不过这篇文章没有源码。
微表情检测（三）----基于光流特征的微表情检测
我是恶魔dark: 你好，看了你的讲解，很详细，想问一下，网络有公开的基于光流法的微表情识别代码吗
深度学习之图像分类（八）InceptionV4论文翻译总结
简单简单小白: 大佬讲述的很清楚，总结的也很详细，让我通俗易懂，又以实例证明技术点的实用性及可操作性，让我受益良多，感谢博主的分享
深度学习之图像分类（八）InceptionV4论文翻译总结
CSDN-Ada助手: 非常祝贺您开始了博客创作的旅程！标题中提到的"InceptionV4论文翻译总结"让我对您的文章产生了浓厚的兴趣。深度学习与图像分类是当今研究的热点领域，而您的博客似乎能够为我们提供关于InceptionV4的深入理解。不过，如果我可以提一个创作建议的话，希望您在文章中能够更多地展示自己对于该论文的思考和见解，这样能够使读者更好地了解您对于该主题的研究。期待您继续创作更多优质的博客！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
深度学习之目标检测（一）R-CNN翻译与总结（一）
CSDN-Ada助手: 这是一篇很棒的博客，深度学习的目标检测一直是一个热门话题，而你对R-CNN的翻译与总结也让人受益匪浅。希望你可以继续分享更多关于深度学习目标检测的内容，比如Faster R-CNN、YOLO等等，这些都是目前非常流行的目标检测方法。另外，你也可以探讨一下在实际项目中如何选择合适的目标检测算法、模型调优和数据增强等实用技能，这些内容也会给读者带来很多启发和帮助。期待你的更多精彩分享！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。