理解机器学习中的偏差与方差

本文探讨了机器学习中的过拟合与欠拟合现象,解释了偏差(预测值与真实值的差距)和方差(预测值的变化范围)的概念。过拟合时模型对噪声数据过于敏感,欠拟合则表明模型未能有效捕获数据特征。为解决高偏差和高方差问题,提出了增加训练实例、调整特征数量、归一化程度等策略。
摘要由CSDN通过智能技术生成

一、过拟合现象

在说明机器学习中的偏差与方差之前,我们先来看一下什么是模型对数据的欠拟合与过拟合。

欠拟合就是模型没有很好地捕捉到数据特征,不能够很好地拟合数据

过拟合就是模型把数据学习的太彻底,以至于把噪声数据的特征也学习到了,这样就会导致在后期测试的时候不能够很好地识别数据,即不能正确的分类,模型泛化能力太差。

二、偏差与方差

然后我们看一下什么是偏差什么是方差。

偏差:描述的是预测值(估计值)的期望与真实值之间的差距。偏差越大,越偏离真实数据,如下图第二行所示。

方差:描述的是预测值的变化范围,离散程度,也就是离其期望值的距离。方差越大,数据的分布越分散,如下图右列所示。



三、过拟合与偏差之间的联系

那在机器学习中模型的过拟合与欠拟合又与偏差和方差有什么关系呢?下图给了我们一个很直观的例子。


四、如何解决高偏差、高方差问题?

那么遇见高偏差或者高方差问题我们应该如何解决呢?

1.  获得更多的训练实例——解决高方差
2.  尝试减少特征的数量——解决高方差
3.  尝试获得更多的特征——解决高偏差
4.  尝试增加多项式特征——解决高偏差
5.  尝试减少归一化程度 λ——解决高偏差
6.  尝试增加归一化程度 λ——解决高方差


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值