机器学习第二周（多元线性回归）

PL_涵

已于 2023-06-10 18:02:42 修改

阅读量103

点赞数

分类专栏：【入门学习ML】文章标签：机器学习线性回归回归

于 2023-05-31 20:39:53 首次发布

本文链接：https://blog.csdn.net/PL_hfc/article/details/130975396

版权

【入门学习ML】专栏收录该内容

15 篇文章 1 订阅

订阅专栏

文章介绍了多元线性回归的概念，从单一特征的线性回归模型扩展到包含多个特征的情况，提出了包含多个特征的假设函数形式，并展示了代价函数和梯度下降在多元线性回归中的应用，讨论了特征数量增加对模型复杂性和训练效率的影响。

摘要由CSDN通过智能技术生成

多元线性回归的引入

单特征
之前我们介绍过房价预测问题，当时我们只使用了一个特征：房子的大小，来对房价进行预测，并且我们得到了该线性回归模型的假设函数： $h_\theta(x)=\theta_0+\theta_1x$ ，如上图所示。但是在实际问题中，能够决定房价的因素（特征 / 变量）肯定不只有一个，所以我们要将之前介绍的线性回归模型推广到更一般的情况，即多元线性回归模型，它更符合实际情况。
多特征
如上图所示，我们在原来的基础上，添加了三个特征 / 变量来描述房子，即房间卧室的数量、房屋的楼层以及房子的年龄。
符号描述
需要注意的是，我们现在开始使用 $n$ 来表示特征的数量，上述问题中，显然 $n = 4$ ；使用 $x^i$ 来表示第 $i$ 个训练样本的输入特征值，并不是表示 $x$ 的 $i$ 次方，对应于上述问题，即表格中的第 $i$ 行，比如，当 $i = 1$ 时，则有 $x^1=[2104,5,1,45]$ （注： $P r i ce$ 为房价真实值，不属于输入特征），习惯上，我们更愿意把 $x^1$ 表示成一个向量的形式，即 $x^1=\begin{bmatrix} 2104\\5\\1\\45 \end{bmatrix}$ ，很显然， $x^1$ 是一个 $4$ 维向量，更一般来说， $x^i$ 会是一个 $n$ 维向量；使用 $x^i_j$ 来表示第 $i$ 个训练样本中第 $j$ 个特征量的值，比如，对应到上述问题，就有 $x^1_3=1$ ，就相当于索引向量 $x^1$ 中的第 $3$ 个元素。

多元线性回归的假设函数

那么，我们现在的假设函数会是什么形式呢？

之前我们线性回归模型的假设函数是 $h_\theta(x)=\theta_0+\theta_1x$ ，现在我们考虑多个因素对房价带来的影响，那么，对应的假设函数应该改写成 $h_\theta(x)=\theta_0+\theta_1x_1+\theta_2x_2+…+\theta_nx_n$ ，其中， $x_i$ 表示第 $i$ 个输入特征值，为了表示方便，我们会再添加一个输入特征值 $x_0$ ，并且令 $x_0=1$ ，即对于每一组训练样本，都有 $x^i_0=1$ ，现在，我们再将特征和参数表示成向量的形式，则有 $x=\begin{bmatrix} x_0\\x_1\\x_2\\…\\x_n \end{bmatrix}\in\R^{n+1}$ ， $\theta=\begin{bmatrix} \theta_0\\\theta_1\\\theta_2\\…\\\theta_n \end{bmatrix}\in\R^{n+1}$

现在我们可以将假设函数表示为 $h_\theta(x)=\theta^T \cdot x=[\theta_0,\theta_1,…,\theta_n] \cdot \begin{bmatrix} x_0\\x_1\\x_2\\…\\x_n \end{bmatrix}=\theta_0+\theta_1x_1+\theta_2x_2+…+\theta_nx_n$ ，这就是多特征量情况下假设函数的形式，也就是所谓的多元线性回归。

多元线性回归的代价函数与梯度下降

多元线性回归的代价函数
上图所示是我们多元线性回归中的一些表达式，其中代价函数 $J(\theta_0,\theta_1,…,\theta_n)=$ $\,\Large1\over {2m}$ $\large\sum_{i=1}^m$ $(h_\theta(x^i)-y^i)^2$ 与之前的代价函数表达式一致，只不过参数的数量增加到了 $n$ 个，当然，上面的表达式中，我们也可以把 $\theta_0,\theta_1,…,\theta_n$ 写成向量 $\theta$ 的形式，使表达式看起来更加简洁，即 $J(\theta)=$ $\,\Large1\over {2m}$ $\large\sum_{i=1}^m$ $(h_\theta(x^i)-y^i)^2$

更新梯度下降算法

多元线性回归的梯度下降法
上图就是多元线性回归中梯度下降的样子。

在这里插入图片描述
上图是之前只有一个特征时的梯度下降算法对应的参数更新方程，即 $n = 1$ 时

现在，我们将梯度下降算法更新，即将参数更新方程推广到更加一般的情况，即 $n\ge1$ 时，对于每一个训练样本 $x^i$ ，我们在更新参数 $\theta_j$ 时，对应偏导数的在括号外的乘积项应该变为 $x^i_j$ ，即第 $i$ 个训练样本中第 $j$ 个特征量的值。

现在，我们介绍完了多元线性回归模型，很显然，相比于单特征的情况，特征数量的增多会使得模型变得复杂，同样也会降低我们训练模型的效率，比如在进行梯度下降时，所以之后我们会来谈谈如何提高多元梯度下降收敛的速度。

PL_涵

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
机器学习第二周（多元线性回归）

现在，我们介绍完了多元线性回归模型，很显然，相比于单特征的情况，特征数量的增多会使得模型变得复杂，同样也会降低我们训练模型的效率，比如在进行梯度下降时，所以之后我们会来谈谈如何提高多元梯度下降收敛的速度。但是在实际问题中，能够决定房价的因素（特征 / 变量）肯定不只有一个，所以我们要将之前介绍的线性回归模型推广到更一般的情况，即多元线性回归模型，它更符合实际情况。如上图所示，我们在原来的基础上，添加了三个特征 / 变量来描述房子，即房间卧室的数量、房屋的楼层以及房子的年龄。，即对于每一组训练样本，都有。
复制链接

扫一扫