岭回归等价于对数据矩阵进行维纳滤波

DioDid

已于 2024-07-26 00:28:10 修改

阅读量830

点赞数 17

文章标签：回归矩阵数据挖掘

于 2024-07-25 15:02:45 首次发布

本文链接：https://blog.csdn.net/qq_40877281/article/details/140690419

版权

岭回归等价于对数据矩阵进行维纳滤波

背景知识之普通最小二乘法

假设训练集 $\mathcal{D}$ 包含 $m$ 个样本 $\left\{\mathbf{x}^{(i)}, y^{(i)}\right\}_{i=1}^{m}$ 。每个样本 $i$ 包括一个标量目标值 $y^{(i)}$ 和一个包含 $n$ 个特征的特征向量 $\mathbf{x}^{(i)}$ ，即 $\mathbf{x}^{(i)}=\left[x_{1}^{(i)}, x_{2}^{(i)}, \dots, x_{n}^{(i)}\right]^{\operatorname{T}}$ 。这一般会是一个过定系统，也就是说方程组中的方程数量多于未知数的数量，也即 $m > n$ 。训练样本数量一般远大于模型参数在线性回归模型中，目标变量 $y^{(i)}$ 是特征的线性函数：

$\sum _{j=1}^{n}x_{j}^{(i)}\theta _{j}=y^{(i)}, \quad (i=1,2,\dots ,m),$

该系统包含 $m$ 个线性方程和 $n$ 个未知系数 $\theta_{1}, \theta_{2}, \dots, \theta_{n}$ ，并且满足 $m > n$ 。可以将其写成矩阵形式为

$\mathbf{X} \boldsymbol{\theta} = \mathbf{y},$

其中

$\mathbf{X} = \begin{bmatrix} x_{1}^{(1)} & x_{2}^{(1)} & \cdots & x_{n}^{(1)} \\ x_{1}^{(2)} & x_{2}^{(2)} & \cdots & x_{n}^{(2)} \\ \vdots & \vdots & \ddots & \vdots \\ x_{1}^{(m)} & x_{2}^{(m)} & \cdots & x_{n}^{(m)} \end{bmatrix}, \quad \boldsymbol{\theta} = \begin{bmatrix} \theta_{1} \\ \theta_{2} \\ \vdots \\ \theta_{n} \end{bmatrix}, \quad \mathbf{y} = \begin{bmatrix} y^{(1)} \\ y^{(2)} \\ \vdots \\ y^{(m)} \end{bmatrix}.$

（注意：对于上述线性模型， $\mathbf{X}$ 的第一列通常全为1，称为"截距项"或"偏置项"，其余列则包含实际的特征数据。这里的 $n$ 等于特征数量加一。）

这样的系统通常没有精确解，因此目标是找到系数 $\boldsymbol{\theta}$ ，使方程的拟合"最佳"，在这种情况下，通过求解二次最小化问题来实现：

$\hat{\boldsymbol{\theta}} = \underset{\boldsymbol{\theta}}{\operatorname{arg\,min}} \, J(\boldsymbol{\theta}),$

其中目标函数 $J$ 定义为

$J(\boldsymbol{\theta}) = \sum_{i=1}^{m}\left(y^{(i)}-\sum_{j=1}^{n}x^{(i)}_{j}\theta_{j}\right)^{2} = \left\| \mathbf{y} - \mathbf{X} \boldsymbol{\theta} \right\|^{2} = \left(\mathbf{y} - \mathbf{X} \boldsymbol{\theta}\right)^{\operatorname{T}}\left(\mathbf{y} - \mathbf{X} \boldsymbol{\theta}\right).$

最低0.47元/天解锁文章

DioDid

关注

17
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
岭回归等价于对数据矩阵进行维纳滤波

假设训练集D包含m个样本xiyii1m。每个样本i包括一个标量目标值yi和一个包含n个特征的特征向量xi，即xix1ix2ixniT。这一般会是一个过定系统，也就是说方程组中的方程数量多于未知数的数量，也即mn。训练样本数量一般远大于模型参数在线性回归模型中，目标变量yij1∑nxjiθjyii12m该系统包含m个线性方程和n个未知系数θ1θ2θn，并且满足m。
复制链接

扫一扫