在微积分中,链式法则是计算两个或多个函数的组合的导数的公式,也就是说,如果f和g是函数,则链式法则表示它们的组合的导数f∘g(将x映射到f(g(x))的函数。由于在定义过程中求导公式可以表示成一个连乘过程,就像锁链一样一环套一环,故而得名。链式法则在计算上简单,在直观上容易理解。下面我们给出正式定义。
设f和g为两个关于x的可导函数,则复合函数$(fog)'(x)$的导数为:
$$(fog)'(x)=f'(g(x))g'(x)$$
如$g(x)=x^2+1$,$h(g)=g^3$,则求导$h(g(x))=g(x)^3$时计算过程应为:
$f'(x)=[h(g(x)]'=3(g(x))^2(2x)=3(x^2+1)^2(2x)=6x(x^2+1)^2$
当函数扩展为多元复合函数$z=f(x,y)$,其中$x=g(t), y=h(t)$且h(t)和g(t)可微,则:
dz/dt=\partial z/\partial x dx/dt+\partial z/\partial y dy/dt
描述
在机器学习领域,链式法则是需要理解的重要基础法则之一,其主要应用在于反向传播(backpropagation)等算法,反向传播算法是在模式识别和故障诊断等领域广泛使用的简单方法。其发明者Werbos于1990年再次讨论反向传播所基于的定理——有序导数(ordered d