(1)请用一个具体的案例解释什么是偏差和方差
真实数据来自某个模型
y
=
a
x
+
b
+
ϵ
,
ϵ
∼
N
(
0
,
1
)
y = ax + b + \epsilon, \epsilon \sim N(0, 1)
y=ax+b+ϵ,ϵ∼N(0,1)
我们进行数据采集,采集了10个点,用一个最高次为10次的多项式模型根据数据来训练并进行预测。
多项式能完美地拟合训练数据。如果从真实数据中再取10个点,那么用同样的模型,损失函数的值会很大,方差度量了同样大小的训练集的变动所导致的学习性能的变化,即刻画了数据扰动所造成的影响。
(2)偏差与方差和误差之间的关系
泛化误差 = 偏差 + 方差 + 误差
(4)岭回归和lasso回归的异同点
相同: 都是为了减少模型的复杂性,降低方差
不同: 两者正则项不同