在深度学习中,数据过拟合,欠拟合的问题很常见,先总结一下:过拟合称为高方差,欠拟合称为高偏差。
可能只看偏差,方差不是很理解,下面先来个百度百科看一下。
偏差(统计学概念)
偏差又称为表观误差,是指个别测定值与测定的平均值之差,它可以用来衡量测定结果的精密度高低。在统计学中,偏差可以用于两个不同的概念,即有偏采样与有偏估计。一个有偏采样是对总样本集非平等采样,而一个有偏估计则是指高估或低估要估计的量
方差
方差是在概率论和统计方差衡量随机变量或一组数据时离散程度的度量。概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。统计中的方差(样本方差)是每个样本值与全体样本值的平均数之差的平方值的平均数。在许多实际问题中,研究方差即偏离程度有着重要意义。
方差是衡量源数据和期望值相差的度量值。
看到这两个解释我就晕了,跟神经网络中的偏差,方差还是有些区别的,下面先看一下偏差和方差是什么样子,然后再说一下我的理解。
最左边的图是一个高偏差状态,中间的是适度拟合,也是我们想要达到的状态,右图是一个高方差的状态。
偏差,是指预测结果和真实值之间的差异,在神经网络中,如果神经网络模型过于简单