Hessian矩阵与多元函数极值

最新推荐文章于 2024-10-05 16:18:15 发布

fu_shuwu

最新推荐文章于 2024-10-05 16:18:15 发布

阅读量5.2k

点赞数

分类专栏： Opencv 文章标签： Opencv Hessian 图像处理

Opencv 专栏收录该内容

49 篇文章 5 订阅

订阅专栏

http://blog.csdn.net/baimafujinji/article/details/51167852

Hessian矩阵与多元函数极值

海塞矩阵（Hessian Matrix），又译作海森矩阵，是一个多元函数的二阶偏导数构成的方阵。尽管它是一个具有悠久历史的数学成果，但是在机器学习和图像处理（例如SIFT和SURF特征检测）中，我们也常常遇到它。所以本文就来向读者道一道Hessian Matrix的来龙去脉。本文的主要内容包括：

多元函数极值问题
泰勒展开式与Hessian矩阵

多元函数极值问题

回想一下我们是如何处理一元函数求极值问题的。例如， f(x)=x2 ，我们会先求一阶导数，即 f′(x)=2x ，根据费马定理极值点处的一阶导数一定等于 0 。但这仅是一个必要条件，而非充分条件。对于 f(x)=x2 来说，函数的确在一阶导数为零的点取得了极值，但是对于 f(x)=x3 来说，显然只检查一阶导数是不足以下定论的。

这时我们需要再求一次导，如果二阶导数 f′′<0 ，那么说明函数在该点取得局部极大值；如果二阶导数 f′′>0 ，则说明函数在该点取得局部极小值；如果 f′′=0 ，则结果仍然是不确定的，我们就不得不再通过其他方式来确定函数的极值性。

如果要在多元函数中求极值点，方法与此类似。作为一个示例，不妨用一个三元函数 f=f(x,y,z) 来作为示例。首先要对函数中的每个变量分别求偏导数，这会告诉我们该函数的极值点可能出现在哪里。即

\partial f \partial x = 0 \partial f \partial y = 0 \partial f \partial x = 0

接下来，要继续求二阶导数，此时包含混合偏导数的情况一共有

9 个，如果用矩阵形式来表示的话就得到

H = ⎡ ⎣ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ \partial 2 f \partial x \partial x \partial 2 f \partial y \partial x \partial 2 f \partial z \partial x \partial 2 f \partial x \partial y \partial 2 f \partial y \partial y \partial 2 f \partial z \partial y \partial 2 f \partial x \partial z \partial 2 f \partial y \partial z \partial 2 f \partial z \partial z ⎤ ⎦ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥

这个矩阵就称为Hessian矩阵。当然上面所给出的仅仅是一个三阶的Hessian矩阵。稍作扩展，我们可以对一个在定义域内二阶连续可导的实值多元函数 f(x1,x2,⋯,xn) 定义其Hessian矩阵 H 如下

H = ⎡ ⎣ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ \partial 2 f \partial x 2 1 \partial 2 f \partial x 2 \partial x 1 ⋮ \partial 2 f \partial x n \partial x 1 \partial 2 f \partial x 1 \partial x 2 \partial 2 f \partial x 2 2 ⋮ \partial 2 f \partial x n \partial x 2 \dots \dots ⋱ \dots \partial 2 f \partial x 1 \partial x n \partial 2 f \partial x 2 \partial x n ⋮ \partial 2 f \partial x 2 n ⎤ ⎦ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥

当一元函数的二阶导数等于 0 时，我们并不能确定函数在该点的极值性。类似地，面对Hessian矩阵，仍然存在无法断定多元函数极值性的的情况，即当Hessian矩阵的行列式为 0 时，我们无法确定函数是否能取得极值。甚至我们可能会得到一个鞍点，也就是一个既非极大值也非极小值的的点。

基于Hessian矩阵，就可以判断多元函数的极值情况了，结论如下

如果是正定矩阵，则临界点处是一个局部极小值
如果是负定矩阵，则临界点处是一个局部极大值
如果是不定矩阵，则临界点处不是极值

如何判断一个矩阵是否是正定的，负定的，还是不定的呢？一个最常用的方法就是顺序主子式。实对称矩阵为正定矩阵的充要条件是的各顺序主子式都大于零。当然这个判定方法的计算量比较大。对于实二次型矩阵还有一个判定方法：实二次型矩阵为正定二次型的充要条件是的矩阵的特征值全大于零。为负定二次型的充要条件是的矩阵的特征值全小于零，否则是不定的。

如果你对二次型的概念仍然不很熟悉，这里也稍作补充。定义含有 n
个变量 x1,x2,⋯,xn 的二次齐次函数