【吴恩达机器学习】第五章多变量线性回归

最新推荐文章于 2021-05-10 22:10:32 发布

zxfhahaha

最新推荐文章于 2021-05-10 22:10:32 发布

阅读量654

点赞数 1

分类专栏：机器学习文章标签：多变量线性回归吴恩达特征缩放

本文链接：https://blog.csdn.net/zxfhahaha/article/details/86532814

版权

机器学习专栏收录该内容

42 篇文章 4 订阅

订阅专栏

多功能

多变量线性回归就是多特征量的情况下的假设形式，也就是用多个变量来预测Y值。
下图为多变量线性回归的假设形式，即 $h_θ（x）=θ^Tx=θ_0x_0+θ_1x_1+θ_2x_2+...+θ_nx_n$ (其中x_0=1)
在这里插入图片描述

多元梯度下降法

上一课时我们知道了多变量线性回归的假设形式，这一课时将学会如何设定该假设的参数，即如何使用梯度下降法来处理多元线性回归。

假设函数，参数及代价函数

在这里插入图片描述
通过之前所学，我们的模型参数为从 $θ_0$ 到 $θ_n$ ，我们把它们看成一个n+1维的 $θ$ 向量，而不是n个独立的参数。

因此我们也不把代价函数 $J(θ_0,θ_1,...,θ_n)$ 看作这n+1个数的函数，而是看成 $J (θ)$ 即 $θ$ 这个向量的函数

梯度下降

下图为梯度下降，即每个参数 $θ_j$ 减去学习率乘以代价函数对参数 $θ_j$ 的偏导
在这里插入图片描述

下面为执行梯度下降时的样子，左侧为n=1个特征也就是单变量线性回归，右侧为多个特征也就是多变量线性回归。其实迭代的方法是一样的，只不过需要迭代的参数变多了而已。
在这里插入图片描述

多元梯度下降法演练 I – 特征缩放

如果一个机器学习问题的多个特征取值在相近的范围内，这样梯度下降法就能更快的收敛，因为它避免了很多额外的迭代。
所以当多个特征的取值范围相差很大，我们就要进行特征缩放。特征缩放就是将特征的取值约束到-1到+1的范围内（或者接近-1到1的范围内，这样就能使梯度下降的速度更快，收敛所需的迭代次数更少。

如何进行特征缩放

常见的特征缩放的方法有两种，一种是将特征除以最大值，另一种是均值归一化。
均值归一化是将要缩放的特征减去平均值再除以该特征的范围：
$x_1=(x_1-u_1)/(max-min)$ u1是平均值

下面是一个均值归一化的例子：
题目要求归一化后 $x_1^{(3)}$ 的值，我们
$u_1 = \frac{89+72+94+69}{4}=81$
$x_3=\frac{(x_3-u_1)}{(max-min)}=\frac{94-81}{94-69}=0.52$
在这里插入图片描述

多元梯度下降法II – 学习率

确保梯度下降正常工作的技巧

为了检查梯度下降算法是否收敛，可以绘制J(θ)和迭代次数的曲线图，也可以通过自动收敛测试。

绘制J(θ)随迭代次数的变化曲线图

在梯度下降算法运行时绘出代价函数J(θ)的值，x轴表示梯度下降算法的迭代次数
在这里插入图片描述
通过这个图像就可以判断梯度下降算法是否已经收敛

自动收敛测试

除此以外还能进行一些自动的收敛测试，也就是让一种算法告诉你梯度下降算法是否已经收敛。
如果代价函数J(θ)一步迭代后的下降小于一个很小的值ε，就判断已经收敛，但是选择一个合适的ε值很难。

如何选择学习率

J(θ)随迭代次数的变化曲线图不仅可以判断梯度下降是否收敛，还可以警告算法有没有正常工作，帮助我们选择合适的学习率。

通过绘制J(θ)随迭代次数的变化曲线图选择学习率

如果曲线如下图一直上升（下图左），表示梯度下降没有正常工作，通常原因如下图右所示学习率α过大导致一直错过最小值，因此当看到下图左所示的曲线时我们应该选择更小的学习率α。

在这里插入图片描述
如果看到下图这样的曲线，也是选择更小的学习率α。

数学家已经证明只要学习率足够小，那么每次迭代之后代价函数J(θ)都会下降。但是学习率过小会导致收敛的特别慢。

即如果学习率太小，收敛的会特别慢；如果学习率过大，则代价函数J（θ）不一定在每次迭代都会下降，甚至可能不收敛。

当我们在运行梯度下降函数时，可以尝试不同的学习率α，如下图每隔三倍取一个值，对于这些不同的α绘制J(θ)随迭代步数变化的曲线，然后选择使得J(θ)快速下降的一个α值
在这里插入图片描述

特征和多项式回归

可供选择的特征

我们可以自由选择不同的特征，并且通过设计不同的特征，用更复杂的函数拟合数据，而不是只用一条直线拟合。
下面是一个例子：
我们要预测房价，有两个特征房子的临街宽度和垂直宽度。但我们运行线性回归时，不一定非要直接用这两个特征，我们可以自己创造新的特征，如房屋的面积，即x1和x2相乘。
在这里插入图片描述

多项式回归

多项式回归就是将一个多项式，如二次函数或三次函数拟合到数据上。
多项式回归使得我们能够用线性回归的方法来拟合非常复杂的函数，甚至是非线性函数。
在这里插入图片描述
比如我们有上图左这样一个住房价格数据集，就会有多个不同的模型用于拟合。如右图的二次模型，但我们知道二次函数最后会降下来（如图蓝线），但是随着房屋面积的增大房价并不会下降，所以二次模型不合理。
所以我们可能会选择一个三次模型（如图绿线。将模型与数据结合的方法就是使用多元线性回归的方法对算法做一个修改。
在这里插入图片描述
也就是有三个特征x1，x2，x3，这三个特征分别是房屋面积，房屋面积的平方和房屋面积的三次方。【这样选特征的话特征缩放就非常重要】