机器学习泛化问题之偏差和方差

当一个模型确定时,我们需要对其进行诊断,判断这个模型是否存在过拟合或者欠拟合。通过偏差与方差我们可以很快捷的评价当前的模型。偏差与方差的直观理解偏差:就是偏离的意思,与“标准”之间的差距。方差:是离散程度,波动程度的意识。图1,2的偏差都比较小(都能在靶心的范围内),但是图1的方差更小(数据集中),而图2则方差更大(数据发散)。图3,4的偏差都比较大(已经脱离了靶心位置)从机器学...
摘要由CSDN通过智能技术生成

无论是什么模型,如线性模型,Logistic回归、神经网络等。对数据的拟合程度:可以直接反应模型的优劣。以下,将是我们讨论的问题:

  1. 如何判断模型对数据的拟合程度
  2. 出现欠拟合,过拟合等情况,我们应该如何进行修改。

针对第一个问题,通过偏差与方差可以衡量模型的拟合程度。我们可以通过两个参数的大小来判断模型是否存在欠拟合、过拟合问题。并以此来判断我们是否需要选择:增加训练集数据量,修改某些参数、增加特征数量等操作。


偏差与方差的直观理解

偏差:就是偏离的意思,与“标准”之间的差距。
方差:是离散程度,波动程度的意识。

在这里插入图片描述

图1,2的偏差都比较小(都能在靶心的范围内),但是图1的方差更小(数据集中),而图2则方差更大(数据发散)。
图3,4的偏差都比较大(已经脱离了靶心位置)


从机器学习方面理解:

偏差:反映的是模型的拟合能力,度量了预测与真实结果的偏离程度,偏差大有可能是欠拟合,也可能是过拟合。如果是欠拟合则训练集与测试集的loss都大(偏差都大),假如是过拟合,则训练集loss小(偏差小),测试集的loss大(偏差大)
**
**
方差:反映的是模型的泛化能力,也可以理解成模型的抗数据扰动的影响,度量的是从训练集训练得到模型在测试集上的性能变化,方差大就意味则过拟合。

在机器学习中评价模型通常用代价函数 J J J, J t r a i n J_{train} Jtrain表示训练的误差, J v a l J_{val}

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值