反向传播 今天进入核心内容,如何计算任意复杂函数的梯度 计算图 图的节点表示我们要进行的每一步的运算 一旦我们能用计算图表示一个计算,我们就可以用它来进行反向传播的求解 反向传播是如何工作的呢? 前向传播:从输入到输出 反向传播:链式法则的递归调用,计算输出对每一个输入量的偏导数,即梯度 加法门:梯度分离 最大门:梯度路由 乘法门:梯度转换器 雅可比矩阵:每一个元素都是偏导数,在此是一个对角矩阵 变量梯度的向量大小应该和变量一致 我们的网络是由一层层堆叠而成,每一层都会用到正想传播和反向传播。