机器学习之多变量线性回归

最新推荐文章于 2023-11-07 09:18:23 发布

谦小白

最新推荐文章于 2023-11-07 09:18:23 发布

阅读量211

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/weixin_38279101/article/details/103781876

版权

机器学习专栏收录该内容

11 篇文章 8 订阅

订阅专栏

文章目录

（一）机器学习之多变量线性回归
- - (1) 常用符号
- (2) 多变量线性回归的梯度下降算法

（一）机器学习之多变量线性回归

(1) 常用符号

以房价模型为例（这里随意给出的数据）：

房屋面积 $m^2)$	卧室数量	房屋层数	房屋年龄(年)	价格(万元)
390	6	4	20	400
1000	8	3	5	5888
600	10	3	10	1286
200	4	1	3	286

$n$ ：表示特征的数量
${x^{\left( i \right)}}$ ：表示第 $i$ 个训练实例(训练样本)，是特征矩阵中的第 $i$ 行，是一个向量（vector）。例如： ${x}^{(2)}\text{=}\begin{bmatrix} 1000\\ 8\\ 3\\ 5 \end{bmatrix}$

${x}_{j}^{\left( i \right)}$ ：表示特征矩阵中第 $i$ 行的第 $j$ 个特征，也就是第 $i$ 个训练实例(训练样本)的第 $j$ 个特征。例如： $x_{2}^{\left( 2 \right)}=8,x_{3}^{\left( 2 \right)}=3$ ，

支持多变量的函数 $h$ 表示为： $h_{\theta}\left( x \right)={\theta_{0}}+{\theta_{1}}{x_{1}}+{\theta_{2}}{x_{2}}+...+{\theta_{n}}{x_{n}}$ ，
这个公式中有 $n + 1$ 个参数和 $n$ 个变量,为了使得公式能够简化一些,引入 $x_{0}=1$ ,则公式转化为： $h_{\theta} \left( x \right)={\theta_{0}}{x_{0}}+{\theta_{1}}{x_{1}}+{\theta_{2}}{x_{2}}+...+{\theta_{n}}{x_{n}}$
此时模型中的参数是一个 $n + 1$ 维的向量，任何一个训练实例(训练样本)也都是 $n + 1$ 维的向量，特征矩阵 $X$ 的维度是 $m * (n + 1)$ 。因此公式可以简化为： $h_{\theta} \left( x \right)={\theta^{T}}X$ ，其中上标 $T$ 代表矩阵转置。
注意：这里的 $h_{\theta} \left( x \right)={\theta^{T}}X$ 表示的是全部训练样本的输出值，因为特征矩阵X表示的是所有的训练样本
注意：下面图片中的 $h_{\theta} \left( x \right)={\theta^{T}}X$ 表示的是其中一个训练样本的输出值，因为下面的特征向量X表示的是其中一个的训练样本
在这里插入图片描述

(2) 多变量线性回归的梯度下降算法

多变量线性回归的代价函数： $J\left( {\theta_{0}},{\theta_{1}}...{\theta_{n}} \right)=\frac{1}{2m}\sum\limits_{i=1}^{m}{{{\left( h_{\theta} \left({x}^{\left( i \right)} \right)-{y}^{\left( i \right)} \right)}^{2}}}$ ，

其中： $h_{\theta}\left( x \right)=\theta^{T}X={\theta_{0}}+{\theta_{1}}{x_{1}}+{\theta_{2}}{x_{2}}+...+{\theta_{n}}{x_{n}}$
（也可以写成 $h_{\theta}\left( x \right)=\theta^{T}X={\theta_{0}}{x_{0}}+{\theta_{1}}{x_{1}}+{\theta_{2}}{x_{2}}+...+{\theta_{n}}{x_{n}}$ ，其中 ${x_{0}}=1$ ）

为了找出使得代价函数最小的一系列参数，我们运用(批量)梯度下降算法：
Repeat{
         ${\theta_{j}}:={\theta_{j}}-\alpha \frac{\partial }{\partial {\theta_{j}}}J\left(\theta_{0}, \theta_{1},...,\theta_{n}\right)$
}
即：
Repeat{
         ${\theta_{j}}:={\theta_{j}}-\alpha \frac{\partial }{\partial {\theta_{j}}}\frac{1}{2m}\sum\limits_{i=1}^{m}{{{\left( h_{\theta} \left({x}^{\left( i \right)} \right)-{y}^{\left( i \right)} \right)}^{2}}}$
}
求导数后得到：
Repeat{
         ${{\theta _j}}:={{\theta _j}}- \alpha\frac{1}{m}\sum\limits_{i=1}^{m}{(({{h_\theta }}({{x}^{(i)}})-{{y}^{(i)}})}x_{j}^{(i)})$
(记得同步更新 ${\theta _j}$ , for j = 0,1,…,n)
}

当 $n > = 1$ 时， ${{\theta _0}}:={{\theta _0}}-a\frac{1}{m}\sum\limits_{i=1}^{m}{({{h_\theta }}({{x}^{(i)}})-{{y}^{(i)}})}x_{0}^{(i)}$

${{\theta _1}}:={{\theta _1}}-a\frac{1}{m}\sum\limits_{i=1}^{m}{({{h_\theta }}({{x}^{(i)}})-{{y}^{(i)}})}x_{1}^{(i)}$

${{\theta _2}}:={{\theta _2}}-a\frac{1}{m}\sum\limits_{i=1}^{m}{({{h_\theta }}({{x}^{(i)}})-{{y}^{(i)}})}x_{2}^{(i)}$

我们一开始随机选择一系列的参数值，计算所有的预测结果后，再根据梯度下降算法给所有的参数一个新的值，如此循环直到收敛。

谦小白

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习之多变量线性回归

文章目录（一）机器学习之多变量线性回归(1) 常用符号(2) 多变量线性回归的梯度下降算法（一）机器学习之多变量线性回归(1) 常用符号以房价模型为例（这里随意给出的数据）：房屋面积(m2)(m^2)(m2)卧室数量房屋层数房屋年龄(年)价格(万元)390642040010008355888600103101286200...
复制链接

扫一扫