机器学习单变量线性回归 (2)梯度下降法

原创已于 2022-10-17 20:07:32 修改 · 570 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #算法 #深度学习

于 2021-08-29 01:39:49 首次发布

【机器学习】同时被 2 个专栏收录

70 篇文章

订阅专栏

深度学习

33 篇文章

订阅专栏

本文详细介绍了如何使用梯度下降算法求解单变量线性回归问题中的参数，通过直观的山地比喻阐述了算法流程，并提供了具体计算步骤。学习率的选择对结果至关重要，最终目标是确定权重参数以最小化代价函数。

机器学习单变量线性回归之梯度下降法

一、前言
二、算法思想
三、算法实现
四、参考资料

一、前言

根据上一篇文章《机器学习单变量线性回归 (1)背景介绍》中的推理，单元线性回归问题变成了求 $w_0$ 、 $w_1$ 两个变量的值，使得代价函数 $J(w_0,w_1)$ 最小。

梯度下降是一个用来求函数最小值的算法，我们将使用梯度下降算法来求出代价函数 $J(w_0,w_1)$ 的最小值。

二、算法思想

存在函数 $J(w_0,w_1,\dots,w_n)$
确定 $w_0,w_1,\dots,w_n$ 的值，使得函数 $J$ 最小

流程：

初始化 $w_0,w_1,\dots,w_n$ ，取任意值即可，如 $w_0=0,w_1=0,\dots,w_n=0$
不断改变 $w_0,w_1,\dots,w_n$ 的值，降低 $J(w_0,w_1,\dots,w_n)$ ，直到我们找到 $J$ 的全局最小值或局部最小值

为了更加容易理解，我们取n=1，即 $J(w_0,w_1)$ 。 $J(w_0,w_1)$ 函数有两个变量，故此函数图是三维的。假设如下图所示，想象成你站在山上的某个位置（ $w_0,w_1$ 初始值决定的位置），想要尽快走下山（尽快找到 $J$ 的最小值）。
在这里插入图片描述

那么你首先会360°观察四周，哪个方向的坡度最陡，然后往前走一段，停下再360°观察四周往最陡的方向走去。。。直到来到一个最低点，四周的坡度都是朝上的了。
在这里插入图片描述
如果初始位置是另一个点，还有可能来到局部最低点，如下图所示：

三、算法实现

对 $J(w_0,w_1)$ 中的 $w_0,w_1$ 分别求偏导，求导相关知识可参考《导数与偏导》。
重复以下计算：
$w_0 = w_0-η*\frac{∂}{∂w_0}J(w_0,w_1)=w_0-η*\frac{∂}{∂w_0}\frac1{2m}\sum_{i=1}^m[w_0 + w_1x^{(i)}-y^{(i)}]^2=w_0-η*\frac1{m}\sum_{i=1}^m(w_0 + w_1x^{(i)}-y^{(i)})$

$w_1 = w_1-η*\frac{∂}{∂w_1}J(w_0,w_1)=w_1-η*\frac{∂}{∂w_1}\frac1{2m}\sum_{i=1}^m[w_0 + w_1x^{(i)}-y^{(i)}]^2=w_1-η*\frac1{m}\sum_{i=1}^m(w_0 + w_1x^{(i)}-y^{(i)})x^{(i)}$