吴恩达深度学习 —— 2.9 逻辑回归中的梯度下降法

最新推荐文章于 2022-10-03 14:08:34 发布

然后就去远行吧

最新推荐文章于 2022-10-03 14:08:34 发布

阅读量378

点赞数

分类专栏：吴恩达深度学习

本文链接：https://blog.csdn.net/qq_37388085/article/details/103253828

版权

吴恩达深度学习专栏收录该内容

61 篇文章 30 订阅

订阅专栏

这一节讨论怎么计算偏导数来实现逻辑回归的梯度下降法，它的核心关键点是其中有几个重要法公式用于实现逻辑回归的梯度下降法。

这里将使用导数流程图来计算梯度，必须承认，用导数流程图来计算逻辑回归的梯度下降有点大材小用了。但以这种方式来讲解可以更好地理解梯度下降，从而在讨论神经网络时，可以更深刻全面地理解神经网络。

回想一下逻辑回归的公式，如下图所示，现在只考虑单个样本的损失函数，现在写出该样本的偏导数流程图，假设样本只有两个特征，分别为 $x_1$ 和 $x_2$ ，为了计算z，我们需要输入参数 $w_1$ 、 $w_2$ 和b，还有样本特征值 $x_1$ 和 $x_2$ ，用这些值来计算z。z的计算公式为 $z = w_1*x_1+w_2*x_2+b$ ，然后计算 $\hat {y}$ ，即 $a = s i g m a (z)$ ，也就是偏导数流程图的下一步，最后计算 $L o s s (a, y)$ 。
在这里插入图片描述

因此在逻辑回归中，需要做的是变换参数w和b的值，来最小化损失函数。在前面我们已经将前向传播步骤在单个训练样本上计算损失函数。
在这里插入图片描述

现在讨论怎么向后计算偏导数，以下是整洁版本的图，要想计算损失函数L的导数，首先要向前一步，计算损失函数的导数，即 $\frac{dLoss(a,y)}{da}$ 。在代码中只需要用da来表示这个变量，即 $\frac{dLoss(a,y)}{da}=-\frac{y}{a}+\frac{1-y}{1-a}$ 。损失函数导数的计算公式就是这样，如果你熟悉微积分，你计算的关于变量a的导数就是这个式子。
在这里插入图片描述

现在计算出 $d a$ ，最终结果关于变量a的导数，现在可以再往后一步，计算 $d z$ ， $d z$ 是代码中的变量名， $d z$ 是损失函数关于z的导数， $dz=\frac{dL}{dz}=\frac{dL}{da}*\frac{da}{dz}=a-y$ 。因为 $\frac{dL}{da}=-\frac{y}{a}+\frac{1-y}{1-a}$ ，同时 $\frac{da}{dz}=a(1-a)$ ，所以 $d z = a - y$ 。

现在是向后传播的最后一步，看看w和b需要如何变化。特别地，关于 $w_1$ 的导数 $dw_1=\frac{dL}{dw_1}=x_1*dz$ ，同理有 $dw_2=x_2*dz$ ， $d b = d z$ 。

因此关于单个样本的梯度下降法所需要做的就是这些事情。

然后就去远行吧

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
吴恩达深度学习 —— 2.9 逻辑回归中的梯度下降法

这一节讨论怎么计算偏导数来实现逻辑回归的梯度下降法，它的核心关键点是其中有几个重要法公式用于实现逻辑回归的梯度下降法。这里将使用导数流程图来计算梯度，必须承认，用导数流程图来计算逻辑回归的梯度下降有点大材小用了。但以这种方式来讲解可以更好地理解梯度下降，从而在讨论神经网络时，可以更深刻全面地理解神经网络。回想一下逻辑回归的公式，如下图所示，现在只考虑单个样本的损失函数，现在写出该样本的偏导数流...
复制链接

扫一扫