目标函数为:
min
w
∣
∣
X
w
−
y
∣
∣
2
2
\min_w||Xw-y||_2^2
wmin∣∣Xw−y∣∣22
对于普通最小二乘的系数估计问题,其依赖于模型各项的相互独立性。 当各项是相关的,且设计矩阵(design matrix) X 的各列近似线性相关, 那么,设计矩阵会趋向于奇异矩阵,这会导致最小二乘估计对于随机误差非常敏感,产生很大的方差。 例如,在没有实验设计的情况下收集到的数据,这种多重共线性(multicollinearity)的情况可能真的会出现。
目标函数:
min
w
∣
∣
X
w
−
y
∣
∣
2
2
+
α
∣
∣
w
∣
∣
2
2
\min_w||Xw-y||_2^2+\alpha||w||_2^2
wmin∣∣Xw−y∣∣22+α∣∣w∣∣22
其中, $α≥0 $是一个控制缩减量(amount of shrinkage)的复杂度参数: α 的值越大, 缩减量就越大,故而线性模型的系数对共线性(collinearity)就越鲁棒.
目标函数:
min
w
1
2
n
s
a
m
p
l
e
s
∣
∣
X
w
−
y
∣
∣
2
2
+
α
∣
∣
w
∣
∣
1
\min_w\frac{1}{2n_{samples}}||Xw-y||_2^2+\alpha||w||_1
wmin2nsamples1∣∣Xw−y∣∣22+α∣∣w∣∣1
范数是一个用于描述长度的函数,分为向量范数和矩阵范数。详细见文章:向量范数:1-范数、2-范数、无穷范数;矩阵范数;欧几里得度量