机器学习中的偏差与方差

最新推荐文章于 2021-04-20 20:12:41 发布

DisguiseR6

最新推荐文章于 2021-04-20 20:12:41 发布

阅读量200

点赞数

分类专栏： # 机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_25614773/article/details/88797682

版权

机器学习算法专栏收录该内容

8 篇文章 0 订阅

订阅专栏

偏差和方差

文章目录

偏差和方差

1 意义

偏差：
- 度量了学习算法的期望预测与真实结果的偏离程度
- 刻画了学习算法本身的拟合能力
方差：
- 度量了同样大小的训练集的变动所导致的学习性能的变化
- 刻画了数据扰动所造成的影响
噪声：
- 表达力当前任务上任何学习算法所能达到的期望泛化误差的下界
- 刻画了学习问题本身的难度

2 偏差和方差主要用于模型的选择

在这里插入图片描述

选择相对较好的模型的顺序：
- 【1】方差小，偏差小 > 【2】方差小，偏差大 > 【3】方差大，偏差小 > 【4】方差大，偏差大

3 公式推导

符号	意义
x	测试样本
D	训练集
$y_D$	x在数据集中的标记
y	x的真实标记
f	训练集D上学得的模型
$f (x; D)$	训练集D上学得的模型 $f$ 在x上的预测输出
$\overline{f}(x)$	模型 $f$ 对x的期望预测输出

以回归任务为例
学习算法的期望预测：

$\overline{f}(x) = \Epsilon_D[f(x;D)]$

使用样本数相同的不同训练集产生的方差为：
$var(x)=\Epsilon_D[(f(x;D)-\overline{f}(x))^2]$
噪声：
$\epsilon^2 = \Epsilon_D[(y_D-y)^2]$
对算法的期望泛化误差进行分解：

说明：

第一个红色：展开（利用E(xY)=E(x)E(Y)，不相关）和常数的均值是自己本身
$\begin{aligned} \Epsilon_D[2(f(x;D)-\overline{f}(x))(\overline{f}(x)-y_D)] &=2*\Epsilon_D[f(x;D)\overline{f}(x)-\overline{f}^2(x)-f(x;D)y_D+\overline{f}(x)y_D] \\ &=2*(\Epsilon_D[f(x;D)\overline{f}(x)]-\overline{f}^2(x)-\Epsilon_D[f(x;D)y_D]+\Epsilon_D[\overline{f}(x)y_D]) \end{aligned}$
噪声的期望为0

于是有：
$\Epsilon(f;D)=bias^2(x) + var(x) + \epsilon^2$

参考

理解机器学习中的偏差与方差

<机器学习>_周志华

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习中的偏差与方差

偏差和方差文章目录偏差和方差1 意义2 偏差和方差主要用于模型的选择3 公式推导参考1 意义偏差：度量了学习算法的期望预测与真实结果的偏离程度刻画了学习算法本身的拟合能力方差：度量了同样大小的训练集的变动所导致的学习性能的变化刻画了数据扰动所造成的影响噪声：表达力当前任务上任何学习算法所能达到的期望泛化误差的下界刻画了学习问题本身的难度2 偏差和方差主...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。