机器学习｜线性回归公式推导模型扩展(脊回归、岭回归、多重共线性、样本权重)

最新推荐文章于 2024-01-07 19:00:19 发布

小牙膏呀

最新推荐文章于 2024-01-07 19:00:19 发布

阅读量837

点赞数 2

分类专栏：机器学习文章标签：线性代数机器学习概率论

本文链接：https://blog.csdn.net/Gy_1999/article/details/120627644

版权

本文详细介绍了线性回归的参数求解过程，包括基础模型及如何扩展到脊回归和岭回归，同时探讨了引入样本权重的情况，以及处理多重共线性和样本数不足的问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

摘要

线性回归是最基本的机器学习模型之一，它可以探索自变量和因变量之间的相关性，被广泛应用于各个领域。本篇博客侧重于模型的参数推导，并在此基础上，对线性回归基础模型进行扩展，包括引入正则化项、引入样本权重等。

一、参数求解

面对数据集 $D={\{x_i, y_i\}^{N}_{i=1}}(x_i \in R^{d}，y_i \in R)$ ，我们构造线性回归模型 $y_{n\times 1}=X_{n\times d}w_{d\times 1}$ ，求解一组系数 $w$ ，使平方损失函数 $L=\frac{1}{2N}\sum^{N}_{i=1}(x_iw-y_i) ^2=||Xw-y||^2$ 达到最小。即，在已知数据集上，求解一组系数 $w$ ，使经验风险 $R_{emp}(w)$ 最小。

根据损失函数，经验风险 $R_{emp}(w)$ 可表示为：
$R_{emp}(w)$
$=\frac{1}{2N}(Xw- y)^{T}(Xw - y)$
$=\frac{1}{2N}(w^{T}X^{T}- y^{T})(Xw - y)$
$=\frac{1}{2N}(w^{T}X^{T}X w - w^{T}X^{T} y-y^{T}X w + y^{T}Y)$