线性回归——最小二乘求解

最新推荐文章于 2023-11-08 18:11:45 发布

云聪

最新推荐文章于 2023-11-08 18:11:45 发布

阅读量3.1k

点赞数

分类专栏：机器学习机器学习算法文章标签：机器学习线性回归最小二乘

本文链接：https://blog.csdn.net/l294265421/article/details/52502830

版权

机器学习同时被 2 个专栏收录

14 篇文章 0 订阅

订阅专栏

机器学习算法

13 篇文章 5 订阅

订阅专栏

线性回归
线性回归用于数值预测，它的主要思想是利用预定的权值将属性进行线性组合来表示类别：
$y = w_0 + w_1x_1 + w_2x_2 + ... + w_nx_n$
其中，y是类别属性值， $x_1, x_2, ..., x_n$ 是一般属性值， $w_1, w_2, ..., x_n$ 是权值， $w_0$ 称为偏置，类似于一元线性回归 $y = ax + b$ 中b。
求解线性回归就是通过已知的一些数据点
$(1, x_1^{i} , x_2^{i}, ..., x_n^{i}, y^{i})$
算出权重 $(w_0, w_1, ..., w_n)$ 。在属性集合中加了一个1，是为了与权重 $w_0$ 对应，属性值的上标i，是指这个属性值属于第i个数据点。

最小二乘求解线性回归
假设我们已知m个数据点的属性值，我们便有了包含m个方程的方程组：
$y^{1} = w_0 + w_1x_1^{1} + w_2x_2^{1} + ... + w_nx_n^{1}$
$y^{2} = w_0 + w_1x_1^{2} + w_2x_2^{2} + ... + w_nx_n^{2}$
…
$y^{m} = w_0 + w_1x_1^{m} + w_2x_2^{m} + ... + w_nx_n^{m}$
方程组可以表示为矩阵形式：

⎡ ⎣ ⎢ ⎢ ⎢ ⎢ ⎢ y 1 y 2 ⋮ y m ⎤ ⎦ ⎥ ⎥ ⎥ ⎥ ⎥ = ⎡ ⎣ ⎢ ⎢ ⎢ ⎢ ⎢ 11 ⋮ 1 x 11 x 21 ⋮ x m 1 \dots \dots ⋱ \dots x 1 n x 2 n ⋮ x m n ⎤ ⎦ ⎥ ⎥ ⎥ ⎥ ⎥ ⎡ ⎣ ⎢ ⎢ ⎢ ⎢ w 0 w 1 ⋮ w n ⎤ ⎦ ⎥ ⎥ ⎥ ⎥

$\left[ \begin{matrix} y^{1} \\ y^{2} \\ \vdots \\ y^{m}\\ \end{matrix} \right] =\left[ \begin{matrix} 1 & x_1^{1} & \cdots & x_n^{1} \\ 1 & x_1^{2} & \cdots & x_n^{2} \\ \vdots & \vdots & \ddots & \vdots \\ 1 & x_1^{m} & \cdots & x_n^{m} \\ \end{matrix} \right] \left[ \begin{matrix} w_0\\ w_1 \\ \vdots \\ w_n \\ \end{matrix} \right]$
其中，

⎡ ⎣ ⎢ ⎢ ⎢ ⎢ ⎢ y 1 y 2 ⋮ y m ⎤ ⎦ ⎥ ⎥ ⎥ ⎥ ⎥

$\left[ \begin{matrix} y^{1} \\ y^{2} \\ \vdots \\ y^{m}\\ \end{matrix} \right]$
称为观测向量，

⎡ ⎣ ⎢ ⎢ ⎢ ⎢ ⎢ 11 ⋮ 1 x 11 x 21 ⋮ x m 1 \dots \dots ⋱ \dots x 1 n x 2 n ⋮ x m n ⎤ ⎦ ⎥ ⎥ ⎥ ⎥ ⎥

$\left[ \begin{matrix} 1 & x_1^{1} & \cdots & x_n^{1} \\ 1 & x_1^{2} & \cdots & x_n^{2} \\ \vdots & \vdots & \ddots & \vdots \\ 1 & x_1^{m} & \cdots & x_n^{m} \\ \end{matrix} \right]$
称为设计矩阵，

⎡ ⎣ ⎢ ⎢ ⎢ ⎢ w 0 w 1 ⋮ w n ⎤ ⎦ ⎥ ⎥ ⎥ ⎥

$\left[ \begin{matrix} w_0\\ w_1 \\ \vdots \\ w_n \\ \end{matrix} \right]$
称为参数向量。
这里假设设计矩阵的各列线性无关，也就是说，用于表示

y $y$ 的其它属性各贡献了不同方向的力量。
我们知道，当

m≤n+1 $m \leq n + 1$ 时，通过消元法，就能求出

(w0,w1,...,wn) $(w_0, w_1, ..., w_n)$ ，有一个解，或者多个解；但是当

m>n+1 $m > n + 1$ 时, 方程可能无解，这时设计矩阵的列向量生成了

R(n+1) $R^{(n + 1)}$ 的一个子空间，也就是设计矩阵的列空间，当观察向量属于列空间时，方程组有解，但是当观测向量不属于列空间时，方程组就没有解了。当方程组没解时，我们该怎么办呢？算近似解。这儿，我们用列空间中离观测向量最近的向量代替观测向量求解方程组。列空间中离观测向量最近的向量就是观测向量列空的正交投影。关于这个结论有一个定理：
假设W是

Rn $R^n$ 空间中的一个字空间，

y $y$ 是

Rn $R^n$ 中的任意向量，

y′ $y'$ 是y在W上的正交投影，那么

y′ $y'$ 是W中最接近

y $y$ 的向量，也就是说，

|y−y′|≤|y−v| $|y-y'| \leq |y-v|$
对所有属于W又异于

y′ $y'$ 的v都成立。其中|y-y’|是指向量

y−y′ $y-y'$ 的模，它的计算公式是：

∑nk=1(y1−y1′)2 $\sum_{k=1}^{n}(y^1 - y^{1'})^2$
使得这个公式的值最小便是“最小二乘”这个名字的由来。
在我们这里，

y $y$ 是观测向量，

y′ $y'$ 就是列空间中用来代替

y $y$ 的向量，叫做预测向量。
接下来的重点就是算观测向量在设计矩阵列空间的正交投影了。我这里简要地给出求一个向量在一个空间中正交投影的计算方法。
如果

{u1,u2,...,up} ${\{u_1, u_2, ..., u_p\}}$ 是

Rn $R^n$ 中子空间W的单位正交基，那么

projwy=(yu1)u1+(yu2)u2+...+(yup)up $proj_wy = (yu_1)u_1 + (yu_2)u_2 + ... + (yu_p)u_p$
其中，

ui $u_i$ 都是向量。
要得到设计向量列空间的单位正交基，可以通过把设计矩阵进行QR分解得到。关于QR分解的定理如下：
如果

m $m$ x

n $n$ 矩阵A的列向量线性无关，那么A可以分解为

A=QR $A=QR$ , 其中Q是一个

m $m$ x

n $n$ 矩阵，其列形成A矩阵列空间的一个单位正交基，R是一个

mn $mn$ x

n <script id="MathJax-Element-295" type="math/tex">n</script>可逆矩阵且在对角线上的元素为正数。

参考资料：
1.《概率导论》第2版，（美）伯特瑟卡斯，（美）齐齐克利斯著，郑忠国，童行伟译
2.《数据挖掘实用机器学习工具与技术》第3版，
（新西兰）威滕（Witten,I.H.），（新西兰）弗兰克（Frank,E.）著，董琳译
3.《线性代数及其应用》第3版，（美）莱（Lay,D.C.）著，刘深泉等译

云聪

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
线性回归——最小二乘求解

线性回归线性回归用于数值预测，它的主要思想是利用预定的权值将属性进行线性组合来表示类别： y=w0+w1x1+w2x2+...+wnxny = w_0 + w_1x_1 + w_2x_2 + ... + w_nx_n
复制链接

扫一扫

专栏目录