week3_多变量线性回归

最新推荐文章于 2024-07-25 17:01:05 发布

星星上的吴彦祖

最新推荐文章于 2024-07-25 17:01:05 发布

阅读量106

点赞数

分类专栏： ML之路文章标签：多变量回归正规方程多变量梯度下降机器学习 ML

本文链接：https://blog.csdn.net/weixin_42877670/article/details/103243712

版权

ML之路专栏收录该内容

3 篇文章 0 订阅

订阅专栏

1：多维特征

以前讨论的是单变量的特征，现在增加更多的特征，例如房价模型中，增加楼房层数，房间数，房子的年份等等，每一个特征为 $\left( {x_{1}},{x_{2}},...,{x_{n}} \right)$ ，n表示共有多少个特征
${x^{\left( i \right)}}$ 表示第 i 行
${x}^{(2)}\text{=}\begin{bmatrix} 1416\\\ 3\\\ 2\\\ 40 \end{bmatrix}$ ，第二行的四个特征
假设h为： $h_{\theta}\left( x \right)={\theta_{0}}+{\theta_{1}}{x_{1}}+{\theta_{2}}{x_{2}}+...+{\theta_{n}}{x_{n}}$
整齐引入 $x_{0}=1$
变成 $h_{\theta} \left( x \right)={\theta_{0}}{x_{0}}+{\theta_{1}}{x_{1}}+{\theta_{2}}{x_{2}}+...+{\theta_{n}}{x_{n}}$
特征矩阵 $X$ 的维度是 $m * (n + 1)$ 可以认为m个房子
因此公式可以简化为： $h_{\theta} \left( x \right)={\theta^{T}}X$ ，其中上标 $T$ 代表矩阵转置。

2：多变梯度下降

和单变量线性回归类似，在多变量线性回归中，也有代价函数，也要求代价函数最小。找一系列 ${\theta_{}}$
$J\left( {\theta_{0}},{\theta_{1}}...{\theta_{n}} \right)=\frac{1}{2m}\sum\limits_{i=1}^{m}{{{\left( h_{\theta} \left({x}^{\left( i \right)} \right)-{y}^{\left( i \right)} \right)}^{2}}}$ ，
其中： $h_{\theta}\left( x \right)=\theta^{T}X={\theta_{0}}+{\theta_{1}}{x_{1}}+{\theta_{2}}{x_{2}}+...+{\theta_{n}}{x_{n}}$ ，
和单变量同理，多变量的梯度下降法表示为：
在这里插入图片描述
带入J：

同时更新所有参数

3：梯度下降法：特征缩放与学习率

特征缩放简单来说是不能让不同的变量数量级差的太大，这会导致梯度下降无法完成。尽量将所有特征的尺度缩放在-1至1之间
最简单的方法是令： ${{x}_{n}}=\frac{{{x}_{n}}-{{\mu}_{n}}}{{{s}_{n}}}$ ，其中 ${\mu_{n}}$ 是平均值， ${s_{n}}$ 是标准差。
学习率:过小速度太慢，过大越过局部最小。通常考虑 $\alpha=0.01，0.03，0.1，0.3，1，3，10$
4：特征与多项式回归
有的回归并不适合线性回归，有时我们需要曲线来适应我们的数据，比如一个二次方模型： $h_{\theta}\left( x \right)={\theta_{0}}+{\theta_{1}}{x_{1}}+{\theta_{2}}{x_{2}^2}$ ，或者三次方模型： $h_{\theta}\left( x \right)={\theta_{0}}+{\theta_{1}}{x_{1}}+{\theta_{2}}{x_{2}^2}+{\theta_{3}}{x_{3}^3}$
在这里插入图片描述
也可以令 ${{x}_{2}}=x_{2}^{2},{{x}_{3}}=x_{3}^{3}$ ，从而将模型转化为线性回归模型。
如果我们采用多项式回归模型，在运行梯度下降算法前，特征缩放很有必要

4：正规方程

除了梯度下降的另一种求解线性回归问题的方法。

一个代价函数如下：
在这里插入图片描述
找代价函数最小值（找一系列 ${\theta_{}}$ ），微积分学过求导即：
$\frac{\partial}{\partial{\theta_{j}}}J\left( {\theta_{j}} \right)=0$ 。
正规方程： $\theta ={{\left( {X^T}X \right)}^{-1}}{X^{T}}y$
X为特征矩阵（包含${{x}_{0}}），y是一个个体的结果，解这个方程得到的就是 ${\theta_{}}$

例：

5：梯度下降与正规方程比较：

在这里插入图片描述
更多详细查看黄海广机器学习笔记。*

星星上的吴彦祖

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
week3_多变量线性回归

1：多维特征以前讨论的是单变量的特征，现在增加更多的特征，例如房价模型中，增加楼房层数，房间数，房子的年份等等，每一个特征为(x1,x2,...,xn)\left( {x_{1}},{x_{2}},...,{x_{n}} \right)(x1,x2,...,xn)，n表示共有多少个特征x(i){x^{\left( i \right)}}x(i)表示第 i 行x(2)=[1416&nbs...
复制链接

扫一扫

专栏目录