摘要
线性回归是最基本的机器学习模型之一,它可以探索自变量和因变量之间的相关性,被广泛应用于各个领域。本篇博客侧重于模型的参数推导,并在此基础上,对线性回归基础模型进行扩展,包括引入正则化项、引入样本权重等。
一、参数求解
面对数据集 D = { x i , y i } i = 1 N ( x i ∈ R d , y i ∈ R ) D={\{x_i, y_i\}^{N}_{i=1}}(x_i \in R^{d},y_i \in R) D={ xi,yi}i=1N(xi∈Rd,yi∈R),我们构造线性回归模型 y n × 1 = X n × d w d × 1 y_{n\times 1}=X_{n\times d}w_{d\times 1} yn×1=Xn×dwd×1,求解一组系数 w w w,使平方损失函数 L = 1 2 N ∑ i = 1 N ( x i w − y i ) 2 = ∣ ∣ X w − y ∣ ∣ 2 L=\frac{1}{2N}\sum^{N}_{i=1}(x_iw-y_i) ^2=||Xw-y||^2 L=2N1∑i=1N(xiw−yi)2=∣∣Xw−y∣∣2达到最小。即,在已知数据集上,求解一组系数 w w w,使经验风险 R e m p ( w ) R_{emp}(w) Remp(w)最小。
根据损失函数,经验风险 R e m p ( w ) R_{emp}(w) Remp(w)可表示为:
R e m p ( w ) R_{emp}(w) Remp(w)
= 1 2 N ( X w − y ) T ( X w − y ) =\frac{1}{2N}(Xw- y)^{T}(Xw - y) =2N1(Xw−y)T(Xw−y)
= 1 2 N ( w T X T − y T ) ( X w − y ) =\frac{1}{2N}(w^{T}X^{T}- y^{T})(Xw - y) =2N1(wTXT−yT)(Xw−y)
= 1 2 N ( w T X T X w − w T X T y − y T X w + y T Y ) =\frac{1}{2N}(w^{T}X^{T}X w - w^{T}X^{T} y-y^{T}X w + y^{T}Y) =2N1(wTXTXw−w