上一篇博客我们讲了最速下降法(梯度下降法),梯度下降法简单,但是收敛的速度较慢。这一篇博客将会讲述牛顿法,牛顿法对于正定二次函数具有二次终止性,有较好的收敛速度。
注:(二次终止性)对于 n 元的正定二次函数求极小值问题的算法,如果从任意点出发,经过有限次迭代就能够求得极小点,我们称这种算法具有二次终止性。具有二次终止性的算法,对于一般函数,一般也有较好的收敛速度。可知最速下降算法不具有二次终止性。
基本思想
如果目标函数
f(x)≈Q(x)=f(xk)+g(xk)T(x−xk)+12(x−xk)TG(x)(x−xk)
其中,
g(x)
为函数
f(x)
的一节偏导数。我们可以对
Q(x)
求极小值,由于
G(x)
是正定的,所以
Q(x)
是正定二次函数,令
∇Q(x)=0
,即
g(xk)+G(xk)(x−xk)=0
由此可求得
x=xk−G