吴恩达深度学习 —— 2.14 向量化逻辑回归的梯度输出

最新推荐文章于 2022-05-08 23:29:25 发布

然后就去远行吧

最新推荐文章于 2022-05-08 23:29:25 发布

阅读量247

点赞数

分类专栏：吴恩达深度学习

本文链接：https://blog.csdn.net/qq_37388085/article/details/103257835

版权

吴恩达深度学习专栏收录该内容

61 篇文章 30 订阅

订阅专栏

这一节将学习如果向量化计算m个训练数据的梯度，强调一下，是同时计算。

前面已经说过，在逻辑回归中，有 $dz^{(1)}=a^{(1)}-y^{(1)}$ ， $dz^{(2)}=a^{(2)}-y^{(2)}$ ，以此类推，一直有 $dz^{(m)}=a^{(m)}-y^{(m)}$ 。设 $dz=[dz^{(1)},dz^{(2)},...,dz^{(m)}]$ $A=[a^{(1)},a^{(2)},...,a^{(m)}]$ $Y=[y^{(1)},y^{(2)},...,y^{(m)}]$ 可以得到 $dz=A-Y=[a^{(1)}-y^{(1)},a^{(2)}-y^{(2)},...,a^{(m)}-y^{(m)}]$ 所以仅需要一行代码，就可以同时完成这所有的计算。在之前的实现中，我们已经去掉了一个for循环，但是仍然有一个遍历训练集的循环，我们使用 $d w = 0$ 将 $d w$ 初始化为0向量，但是我们还有一个遍历训练集的循环，对第一个训练样本有 $dw+=x^{(1)}*dz^{(1)}$ ，第二个样本有 $dw+=x^{(2)}*dz^{(2)}$ ，重复m次，最后取均值得到 $d w / = m$ 。同理，b也类似。

$d b$ 被初始化为0向量，然后 $db+=dz^{(1)}$ ， $db+=dz^{(2)}$ ，一直重复到 $db+=dz^{(m)}$ ，最后取均值得到 $d b / = m$ 。

我们去掉了一个for循环，现在 $d w$ 是一个向量了。但还有一个for循环遍历训练集，我们继续下面的操作把它们向量化。

向量化的实现， $d b$ 只需要对 $d z$ 求和，然后除于m，有 $db=\frac{1}{m}\sum_{i=1}^mdz^{(i)}=\frac{1}{m}np.sum(dZ)$ 对于 $d w$ ，有 $dw=\frac{1}{m}*X*dZ^T=\frac{1}{m}[x^{(1)}dz^{(1)}+x^{(2)}dz^{(2)}+...+x^{(m)}dz^{(m)}]$
在这里插入图片描述
现在我们回顾之前所学，没有向量化效率非常低，通过向量化，将上图中的for循环变为 $Z=w^TX+b=np.dot(w^T,=X)+b$ $A=\sigma(Z)$ $d Z = A - Y$ $dw=\frac{1}{m}XdZ^T$ $db=\frac{1}{m}np.sum(dZ)$ $w=w-\alpha dw$ $b=b-\alpha db$ 有了以上这些，就实现了逻辑回归的一次梯度下降，如果需要多次迭代进行梯度下降，仍然不可避免地需要for循环。

然后就去远行吧

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
吴恩达深度学习 —— 2.14 向量化逻辑回归的梯度输出

这一节将学习如果向量化计算m个训练数据的梯度，强调一下，是同时计算。前面已经说过，在逻辑回归中，有dz(1)=a(1)−y(1)dz^{(1)}=a^{(1)}-y^{(1)}dz(1)=a(1)−y(1)，dz(2)=a(2)−y(2)dz^{(2)}=a^{(2)}-y^{(2)}dz(2)=a(2)−y(2)，以此类推，一直有dz(m)=a(m)−y(m)dz^{(m)}=a^{(m)}-...
复制链接

扫一扫

专栏目录