主题:误差反向传播法
(误差反响传播法是一个可以高效计算梯度的算法)
1.什么是计算图?
要正确理解误差反向传播法,有两种方法:1.基于数学式;2.基于计算图(computational graph)
计算图将计算过程用图形表示出来。这里说的图形是数据结构图,通过多个节点和边表示(连接节点的直线称为“边”)
用计算图解题需要按照如下流程进行:
(1)构建计算图
(2)在计算图上,从左向右进行计算(正向传播forward propagation,从计算图出发点到结束点的传播。也有反向传播backward propagation)
计算图的特征是可以通过传递“局部计算”获得最终结果。
“局部”指“与自己相关的某个小范围”
“局部计算”指无论全局发生了什么,都能只根据与自己相关的信息输出接下来的结果。
计算图的优点:
虽然局部计算非常简单,但是通过传递它的计算结果,可以获得全局的复杂计算的结果;利用计算图可以将中间的计算结果保存起来。
可以通过计算图的正向传播和反向传播高效地计算各个变量的导数值。
2.什么是反向传播的链式法则?
反向传播将局部导数向正方向的反方向传递(从右到左)。传递这个局部导数的原理是基于链式法则(chain rule)的。
链式法则要先从 复合函数 说起:
复合函数是由多个函数构成的函数。
例如:
构成:
链式法则是关于复合函数的导数的性质:如果某个函数由复合函数表示,则该复合函数的导数可以用构成复合函数的各个函数的导数的乘积表示。以上式为例:
3.如何实现乘法和加法的反向传播?
加法
乘法
例题1
例题2
例题2解: