偏差与方差及如何权衡

Pr4da

于 2020-07-01 00:19:23 发布

阅读量2.1k

点赞数

分类专栏：机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40210586/article/details/107053414

版权

机器学习专栏收录该内容

16 篇文章 1 订阅

订阅专栏

1.什么是偏差与方差

偏差(Bias)和方差(Variance)是机器学习训练中不可避免的问题。
先来看看什么是偏差和方差：
在这里插入图片描述
我没看到左下角这幅图，箭完全偏离了靶心，这种情况叫做偏差。
再看右上角这幅图，箭随机分布在靶心周围，这叫方差。
可以把靶心看作模型的预测目标，箭看作模型的预测值，模型的预测结果也同样会出现偏差和方差两种情况。

一个模型的误差通常来源于三种情况：
模型误差=偏差+方差+不可避免误差
不可避免误差往往是无法消除的，例如环境噪声等。

2.造成偏差与方差的原因

偏差的出现往往是模型本身有问题，例如我们的要拟合一个二次函数，但是预测模型为一个一次函数，预测结果就会出现偏差。
方差的体现一般在输入数据的一个细微扰动就会得到不同的输出结果，通俗的来说模型可能连输入数据里的噪声也一起学到了，所以测试数据与训练数据分布稍有不同预测结果就会有较大差异。

参数化算法对数据进行参数化，形成很多的特征，这种方法训练速度非常快，而且也不需要很多的数据，但是他不是很灵活。这些方法通常都是高偏差的，例如逻辑回归
非参数化算法对目标函数做出很少或者根本不做任何假设，但是它需要更多的数据，训练速度非常慢，模型复杂度非常高，但是模型非常强大。这些方法通常都是高方差的，例如KNN、决策树

3.如何平衡偏差与方差

在上面的例子中我们可以看到一个趋势：参数或者线性的机器学习算法一般都会有一个很高的偏差和一个很低的方差。但是，非参数或者非线性的机器学习算法一般都有一个很低的偏差和一个很高的方差。所有，我们需要在这两者之间找到一个平衡点，来优化我们的算法。想要获得低方差和低偏差是矛盾的，我们只能对他们做一个平衡。

比如，KNN 算法有很低的偏差和很高的方差，但是我们可以通过调整 k 的值来改变偏差和方差之间的权衡关系，从而达到一个比较平衡的状态。

在机器学习领域,主要的挑战来自方差,当然主要是在算法方面,实际问题中原因不尽相同

解决高方差的通常手段:

1.降低模型复杂度
2.减少数据维度;降噪
3.增加样本数
4.使用验证集
5.模型正则化

参考：
https://www.cnblogs.com/VitoLin21/p/11376335.html
https://blog.csdn.net/CoderPai/article/details/80494230

关注

0
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
偏差与方差及如何权衡

1.什么是偏差与方差偏差(Bias)和方差(Variance)是机器学习训练中不可避免的问题。先来看看什么是偏差和方差：我没看到左下角这幅图，箭完全偏离了靶心，这种情况叫做偏差。再看右上角这幅图，箭随机分布在靶心周围，这叫方差。可以把靶心看作模型的预测目标，箭看作模型的预测值，模型的预测结果也同样会出现偏差和方差两种情况。一个模型的误差通常来源于三种情况：模型误差=偏差+方差+不可避免误差不可避免误差往往是无法消除的，例如环境噪声等。2.造成偏差与方差的原因偏差的出现往往是模型本身有问
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。