偏差和方差理论

最新推荐文章于 2024-05-23 19:32:12 发布

logos25

最新推荐文章于 2024-05-23 19:32:12 发布

阅读量552

点赞数

本文链接：https://blog.csdn.net/z140581/article/details/118885507

版权

本文探讨了偏差和方差在模型预测中的作用，偏差衡量模型预测与实际值的偏离，方差反映了模型预测值的波动。随着模型复杂度增加，方差增大，偏差减小。训练误差与测试误差揭示了过拟合现象。岭回归和Lasso回归通过正则项提升泛化能力，PCA降维和特征归一化是优化方法。

摘要由CSDN通过智能技术生成

1、偏差衡量了模型的预测值与实际值之间的偏离关系。通常在深度学习中，我们每一次训练迭代出来的新模型，都会拿训练数据进行预测，偏差就反应在预测值与实际值匹配度上，形象理解为“偏离实际值的距离”；方差描述的是训练数据在不同迭代阶段的训练模型中，预测值的变化波动情况，即每个预测值与预测均值差的平方和的再求平均数，可以认为是预测值之间的离散程度。

2、测试均方误差的期望＝方差＋偏差的平方 + 误差，一般来说，随着模型复杂度的增加，方差会逐渐增大，偏差会逐渐减小。

3、训练误差是在训练阶段的误差，即预测曲线与训练数据之间的误差，而测试误差是训练得到的预测曲线在预测新数据时形成的误差。一个训练误差很小的模型可以达到0误差，但是其测试误差可能很大。也就是出现了过拟合（overfitting），模型很适合这套训练数据，但如果用测试数据来检验模型，就会发现泛化能力差，准确度下降。

4、岭回归的目标函数在一般的线性回归的基础上加入了正则项，在保证最佳拟合误差的同时，使得参数尽可能的“简单”，使得模型的泛化能力强。正则项一般采用一，二范数，使得模型更具有泛化性，同时可以解决线性回归中不可逆情况，比如二范数对应的岭回归。Lasso回归采用一范数来约束，使参数非零个数最少。而Lasso和岭回归的区别很好理解，在优化过程中，最优解为函数等值线与约束空间的交集，正则项可以看作是约束空间。可以看出二范的约束空间是一个球形，一范的约束空间是一个方形，这也就是二范会得到很多参数接近的值，而一范会尽可能非零参数最少。

5、三维椭球pca降维后是二维的椭圆。

6、对单个特征进行归一化

最低0.47元/天解锁文章

logos25

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
偏差和方差理论

1、偏差衡量了模型的预测值与实际值之间的偏离关系。通常在深度学习中，我们每一次训练迭代出来的新模型，都会拿训练数据进行预测，偏差就反应在预测值与实际值匹配度上，形象理解为“偏离实际值的距离”；方差描述的是训练数据在不同迭代阶段的训练模型中，预测值的变化波动情况，即每个预测值与预测均值差的平方和的再求平均数，可以认为是预测值之间的离散程度。2、测试均方误差的期望＝方差＋偏差的平方+ 误差，一般来说，随着模型复杂度的增加，方差会逐渐增大，偏差会逐渐减小。3、训练误差是在训练阶段的误差，即预测曲.
复制链接

扫一扫