【吴恩达机器学习笔记】二、单变量线性回归

Pandaconda

已于 2022-12-10 08:43:19 修改

阅读量631

点赞数

分类专栏：机器学习文章标签：线性回归回归 c++ 算法

于 2022-11-24 18:47:40 首次发布

本文链接：https://blog.csdn.net/Newin2020/article/details/128024254

版权

机器学习专栏收录该内容

18 篇文章 10 订阅

订阅专栏

这篇博客详细介绍了单变量线性回归和梯度下降的概念。博主整理了吴恩达机器学习课程的内容，包括假设函数、代价函数（特别是平方误差代价函数）以及梯度下降算法的解释。文中强调了如何通过最小化代价函数找到最优参数，并探讨了梯度下降可能遇到的局部最优解问题。最后，博主展示了线性回归模型与梯度下降如何结合，用于找到全局最优解，并指出线性回归的代价函数具有唯一最小值的特性。

摘要由CSDN通过智能技术生成

✍个人博客：https://blog.csdn.net/Newin2020?spm=1011.2415.3001.5343
📣专栏定位：为学习吴恩达机器学习视频的同学提供的随堂笔记。
📚专栏简介：在这个专栏，我将整理吴恩达机器学习视频的所有内容的笔记，方便大家参考学习。
💡专栏地址：https://blog.csdn.net/Newin2020/article/details/128125806
📝视频地址：吴恩达机器学习系列课程
❤️如果有收获的话，欢迎点赞👍收藏📁，您的支持就是我创作的最大动力💪

二、单变量线性回归

常用表达符号：

在这里插入图片描述

假设函数（Hypthesis）

在这里插入图片描述

假设函数通过找到最优的两个参数，从而去获得一个与数据最佳拟合曲线。

1. 代价函数

定义：通过**代价函数（cost function）**得到的值，来获得最优解，值越小代表准确度越高。
所以我们要通过找到代价函数的最小值，从而得到其对应的参数值，然后得到最佳拟合曲线。

平方误差代价函数（The squared error dost function）

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-7iNiodUz-1669286287654)(吴恩达机器学习.assets/image-20211025200229839.png)]

其中在算式前面除以二是方便后续的求导计算，此函数可以解决大部分的回归问题。

这就是我们的线性回归模型。

而我们可以通过简化假设函数，从而去更好理解代价函数背后的含义。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-i2bsNN3Z-1669286287657)(吴恩达机器学习.assets/image-20211025205244393.png)]

其代价函数图像如下：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-n4Dtm1ei-1669286287661)(吴恩达机器学习.assets/20161019210000001.png)]

上面我们可以知道当参数等于1时，代价函数的值最小，所以将参数带回假设函数的方程中，我们就可以得到一条与数据能够最佳拟合的曲线。如果参数更多的话，就会更加复杂，下面是两个参数的三维图像：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-hYGUvNfk-1669286287663)(吴恩达机器学习.assets/20161019210322838.png)]

小结

因此，对于回归问题，我们只用归结为求出代价函数的最小值即可，下面就是我线性回归的目标函数。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Y77m3Tqt-1669286287667)(吴恩达机器学习.assets/20161019210740285.png)]

2. 梯度下降

定义：我们会得到初始化的参数，然后通过改变参数不断地去寻找更小的J值。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-EuajsClb-1669286287670)(吴恩达机器学习.assets/image-20211027220610954.png)]

注意
- 梯度下降的其中一个特点为，你可能会因为初始位置的偏差而得到两个不同的局部最优解，就如下图

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-wMXbicA4-1669286287671)(吴恩达机器学习.assets/image-20211027220759265.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-w2HureQE-1669286287672)(吴恩达机器学习.assets/image-20211027220836846.png)]

梯度下降算法（Gradient Descent Algorithm）

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-3UGBXJEo-1669286287673)(吴恩达机器学习.assets/image-20211027224629083.png)]

赋值与等号

：=在计算机中代表赋值，即将b赋值给a
=在计算机中代表真假判定，即判断a是否等于b

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-kG2cIGA4-1669286287674)(吴恩达机器学习.assets/image-20211027231556413.png)]

算式中α用来控制下降的速率，值越大则梯度下降的越快，但是α的值不能太大或太小，原因如下：

如果α太小，则需要很多很多步才能到达最低点。
如果α太大，可能会导致无法收敛甚至发散，它可能会越过最低点。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-2YOdlNyQ-1669286287675)(吴恩达机器学习.assets/image-20211027230242584.png)]

在梯度下降算法中，参数要同时更新，即下图图左侧为正确操作，右侧为不正确操作。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-RfrvFQgV-1669286287676)(吴恩达机器学习.assets/image-20211027224134036.png)]

在算式最右边的那一块导数部分是J函数对参数求偏导即为切线斜率，详解如下：

如果所选参数在J函数曲线中切线斜率为正，那么导数块部分也为正，即参数会减去一个正值，从图像上来看，参数减小的方向往左即是往曲线最低点方向进行。
如果所选参数在J函数曲线中切线斜率为负，那么导数块部分也为负，即参数会减去一个负值，也就是加上一个正值，从图像上来看，参数增大的方向往右即也是往曲线最低点方向进行。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-I5YDV6er-1669286287677)(吴恩达机器学习.assets/image-20211027225214043.png)]