吴恩达机器学习week2

最新推荐文章于 2021-08-21 13:03:20 发布

Christan_yu

最新推荐文章于 2021-08-21 13:03:20 发布

阅读量189

点赞数

分类专栏：吴恩达机器学习课程笔记文章标签：机器学习

本文链接：https://blog.csdn.net/weixin_42228607/article/details/113134604

版权

2 篇文章 0 订阅

订阅专栏

week2

输入的变量说明
在这里插入图片描述
多元变量的假设函数如下

如果用矩阵来表示，就是如下的结果（注意：此处默认x0这个变量是1，为了和假设函数的第一个参数对应，这样可以用两个n+1维的向量相乘）

多元和一元的本质是一样的，我们只需要对每一个参数都进行求导迭代，最后达到收敛
在这里插入图片描述
如下两张图是一元和多元的区别（主要区别在于对每个参数进行求导之后乘对应的第i个变量xi即可）

我们可以通过让我们的特征值都大致在一个范围内来加快梯度下降的速度，因为θ在小范围的时候会下降的快，大范围时下降的慢

**ps:**The quizzes in this course use range - the programming exercises use standard deviation.

检测梯度下降是否有效的两种方法

debug方式：以迭代次数为x轴，纵轴为损失函数，如果损失函数在增加，那么应该增加α的值
自动收敛测试：声明如果损失函数减少的值在一轮迭代中少于E（比如10-3）,那么就认为收敛，但是在实际中很难选到合适的α

总结: 如果α过于小，那么会收敛很慢（下坡慢）；如果α太大，那么会造成在每一轮的迭代中损失函数并不下降，导致最终无法收敛

如果我们的数据不能够很好的贴合线性回归，那么我们可以将假设函数修改为高次多项式
比如：我们的假设函数是如下的线性函数
在这里插入图片描述
那么我们可以将它变为高次的例如

当然，我们还可以对特征进行改动

这样的情况下一定要注意特征放缩

公式：
在这里插入图片描述
将所有特征按照图示方法转化为（m*n+1）的矩阵即可，x0默认用1；结果是一个m维的列向量

对于正态方程的方法来说不需要对特征值进行一个标准化

正态方程和梯度下降的优缺点对比如下：

一般当N超过万的数量级时选用梯度下降会更加快

在实际应用的过程中可能会出现求矩阵的逆时不可逆的情况。这种情况大致有两种原因：

关注

专栏目录