深度学习计算图&计算图求导过程&向量化

最新推荐文章于 2024-08-16 17:33:04 发布

置顶 soullines

最新推荐文章于 2024-08-16 17:33:04 发布

阅读量2.5k

点赞数 6

分类专栏： Machine Learning &amp; Algorithm 文章标签：计算图向量化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/soullines/article/details/97968011

版权

Machine Learning & Algorithm 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

深度学习中,计算是核心部分,所以一直在致力于提供算法网络的计算能力,比较基础的两种优化形式有:

1.将计算过程做为一个计算图来进行运算,每个计算过程用节点来模拟,这样的好处可以分割运算,甚至可以多线程,多gpu开session来进行运算
2.向量化:以tensorflow为例,进行向量化的运算,由于python独有的广播机制,向量化运算不需要显式的for循环,可以大大提高运算速度

下面具体来看深度网络框架中的计算图 && 向量化运算

1.计算图
 2.向量化

1.计算图

在深度学习中有图的概念: 创建计算节点链接成一个计算图,每个节点是一个 $t e n s o r$ 用于记录变量

下面是一个标量的简单例子,我们模拟前馈传递和反向传播的过程:

基础函数: $J (x, y, z) = 2 (x y + y z)$

那么构建其计算图:

在这里插入图片描述

前馈过程:

第一步: 初始化 $x, y, z$
第二步:令 $\; v =yz$
第三部: 令 $p = u + v$
最后一步: $J (x, y, z) = J (u, v) = J (p) = 2 p$ 这样一个计算过程就一步步分解出来

反向微分过程:

从 $J$ 开始反向传播: $d p = d J / d p = 2$
$\;dp/du= 2 * 1 = 2$ , $dJ/dp\; dp/dv = 2 * 1 = 2$
接着求 $d x, d y, d z$

$d x = d u d u / d x = 2 y$

$d y = d u d u / d y + d v d v / d y = 2 x + 2 z$

$d z = d v d v / d z = 2 y$

不难发现计算图反向梯度下降的时候是逐级递归相乘的,这就是深度学习中的链式相乘法则,我们只有一个模型,在神经网络中会链式相乘的参数会逐级递增来更新每一个网络层的参数

我们接着来看logistic回归的计算图,这里使用Andrew NG文档中的一个图:

在这里插入图片描述

前馈的过程如图,也是一个节点简单运算,向后递归的过程:

我们来看反向传播过程:

$da = dl/da = d(-(ylogy^{pre}+(1-y)log(1-y^{pre}) )) = -y/a + (1-y)/1-a$
$\; da/dz = a - y$
$dw1 = x_1\;dz \;\;\;\;\; dw2 = x_2\;dz \;\;\;\;\;dz \; db = dz$

2.向量化

在常规的编程中:

比如对于一个多实例,多特征的网络中,至少要用到两个for循环,这会大大降低算法的效率:

如下面的公式

前馈过程 :

$y^pre = \sigma(w_!^Tx_1^{(i)} + w_2^Tx_2^{(i)} + b)$

反向传播过程(直接使用上面的公式)

$\sum_{i =0}^{m}x_1^(i)\;dz = \sum_{i =0}^{m}x_1^(i)(\sigma(w_1^Tx_1^{(i)} + w_2^Tx_2^{(i)} +b) - y)$

这样来看实现上述的前馈过程和反向传播,至少需要两层for循环一层遍历实例一层遍历实例中的特征,那么算法将会奇慢无比

但是python中支持向量化的运算所以我们直接利用相关Api进行矩阵运算或者向量运算

那么

前馈过程:

$Y = sigma(W^TX +b))$

反向传播过程:

$d\;W = Xdz = X(\sigma(W^TX +b) - y)$

有兴趣的可以试一下,时间的量级可以提升2个量级以上

关注

6
点赞
踩
8

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。