自动微分(Auto differentiation)

最新推荐文章于 2022-10-22 22:25:12 发布

chuanauc

最新推荐文章于 2022-10-22 22:25:12 发布

阅读量5k

点赞数 9

分类专栏：名词解释文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41764621/article/details/122284820

版权

名词解释专栏收录该内容

9 篇文章 0 订阅

订阅专栏

1.自动微分是干什么的：

自动微分现在已经是深度学习框架的标配，我们写的任何模型都需要靠自动微分机制分配模型损失信息，从而更新模型。简言之，就是在模型更新计算梯度的时候会用到自动微分。

在数学和计算机代数中，自动微分有时称作演算式微分，是一种可以借由计算机程序计算一个函数导数方法。两种传统做微分的方法为：

对一个函数的表示式做符号上的微分，并且计算其在某一点上的值。
使用差分。（即数值微分）

使用符号微分最主要的缺点是速度慢及将计算机程序转换成表示式的困难，且很多函数在要计算更高阶微分时会变得复杂。

使用差分的两个重要的缺点是舍弃误差及数值化过程和相消误差。此两者传统方法在计算更高阶微分时，都有复杂度及误差增加的问题。自动微分则解决上述的问题。

2.现有四种微分方式：

Symbolic Differentiation（符号微分）
Numerical Differentiation（数值微分）
Forward-Mode Autodiff（前向自动微分）
Reverse-mode Autodiff（反向自动微分）

其中，TensorFlow采用的是第四种微分方式

2.1 符号微分

在这里插入图片描述

在这里插入图片描述

2.2 数值微分

在这里插入图片描述

2.3 前向自动微分

在这里插入图片描述

在这里插入图片描述

稍微对上述性质做一下解释：

有一个dual数 $\varepsilon$ ，当函数变量为一元时：有 $h(a+\varepsilon )=h(a)+{h}'(a)*\varepsilon$

当函数变量为一元时：有 $h(a+\varepsilon ,b)=h(a,b)+ [ \frac{\partial }{\partial a}h(a,b) ]* \varepsilon$

$h(a ,b+\varepsilon)=h(a,b)+ [ \frac{\partial }{\partial b}h(a,b) ]* \varepsilon$

在这里插入图片描述

2.4 反向自动微分

在这里插入图片描述

第一次的正向计算穿过图就是从图底往上，即从n1,n2计算到n7 (根据各个节点的表达式，带入数值x=3,y=4计算得来)

3.一些链接：

TensorFlow的自动微分文档：梯度和自动微分简介 | TensorFlow Core

4 关于自动微分当前的一些不足：

1. 在 ICLR 2020 的一篇 Oral 论文中，图宾根大学的研究者表示，目前深度学习框架中的自动微分模块只会计算批量数据反传梯度，但批量梯度的方差、海塞矩阵等其它量也很重要，它们可以在计算梯度的过程中快速算出来。目前自动微分框架（TensorFlow）只计算出梯度，因此就限定了研究方向只能放在梯度下降变体之上，而不能做更广的探讨。为此，研究者构建了 BACKPACK，它建立在 PyTorch 之上，还扩展了自动微分与反向传播能获得的信息。

2. 稀疏图加速（未完）

参考链接：

1.https://blog.csdn.net/qq_36810398/article/details/88738239

关注

9
点赞
踩
53

收藏

觉得还不错? 一键收藏
3
评论
自动微分(Auto differentiation)

1.自动微分是干什么的：自动微分现在已经是深度学习框架的标配，我们写的任何模型都需要靠自动微分机制分配模型损失信息，从而更新模型。简言之，就是在模型更新计算梯度的时候会用到自动微分。在数学和计算机代数中，自动微分有时称作演算式微分，是一种可以借由计算机程序计算一个函数导数方法。两种传统做微分的方法为：对一个函数的表示式做符号上的微分，并且计算其在某一点上的值。使用差分。（即数值微分）使用符号微分最主要的缺点是速度慢及将计算机程序转换成表示式的困难，且很多函数在要计算更高阶微分时会变得复杂。
复制链接

扫一扫

专栏目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。