测试数据上的平均误差是由bias和variance造成的
?什么是bias
?什么是variance
Error = Bias + Variance
Error反映的是整个模型的准确度,Bias反映的是模型在样本上的输出与真实值之间的误差,即模型本身的精准度,Variance反映的是模型每一次输出结果与模型输出期望之间的误差,即模型的稳定性。
!越简单的model variance可能会越小,越复杂的variance会越大
!bias与之相反
一般bias大而variance小往往说明模型欠拟合;
一般variance大而bias小往往说明过拟合,过拟合需要增大数据量;
?如何解决variance大的问题
正则化:regulation
!可能会伤害bias
模型选择
trade off bias and variance
交叉验证
图片均来自视频截图
https://www.bilibili.com/video/BV1Ht411g7Ef?p=5