基本概念
在最小二乘法概念及scikit-learn实操中提到最小二乘法适用于为满秩矩阵或正定矩阵,但是实际情况下,由于特征数量n多于样本数量m,或者属性之间存在复共线性,都有可能导致不是满秩矩阵或正定矩阵。为了解决这个问题,岭回归算法的基本思想是在上加上一个使得矩阵可逆,即,其中是的单位矩阵。
岭回归的目标函数也变为,其中称为L2正则化项,称为正则化项的系数。
代码实现
假设目标函数为
已知当,,时,,当,, 时,,设置正则化项的系数为0.5
则岭回归求参数的代码如下所示
from sklearn import linear_model
rep = linear_model.Ridge(alpha=0.5)
rep.fit([[a1,b1,c1],[a2,b2,c2]],[d1,d2])
print(rep.coef_)
print(reg.intercept_)