上图中偏差表示蓝色圆点距离中央红心的远近,方差表示蓝色圆点的聚集或者分散程度
偏差
导致偏差的主要原因:对问题本身的假设不正确。如:非线性数据使用线性回归
欠拟合就是这样的例子
方差
数据的一点点扰动都会较大的影响模型。换句话来说就是模型没有充分的学习到问题的实质,而学习到了很多的噪音。
通常的原因是使用的模型太复杂,如高阶多项式回归。
过拟合就会极大的引入方差。
knn算法中,k越小,模型越复杂,则方差越大,偏差越小
多项式回归中,degree的值越小,则模型越简单,偏差就越大,反之degree的值越大则曲线越复杂,方差越大
偏差和方差通常的矛盾的。
降低偏差就会提高方差,降低方差就会提高偏差。
太高的方差会导致过拟合,模型的泛化能力弱。
太高的方差会导致模型太偏离原问题。