Hessian 矩阵（海森矩阵）

最新推荐文章于 2025-03-18 22:21:51 发布

Chen_Chance

最新推荐文章于 2025-03-18 22:21:51 发布

阅读量1.3w

点赞数 19

文章标签：矩阵算法机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44154915/article/details/134479134

版权

Hessian矩阵是一个包含二阶偏导数的矩阵，用于表示多元函数的局部特性。它在优化中判断极值点性质，如正定性指示局部最小值，负定性则为局部最大值。牛顿法等算法广泛应用Hessian。例如，对二元函数f(x,y)=x^2+2y^2，Hessian矩阵显示原点是局部最小值点。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Hessian 矩阵（海森矩阵）是一个包含二阶偏导数信息的方阵，在数学和优化中起着重要作用。对于一个多元函数，其 Hessian 矩阵是由其各个变量的二阶偏导数组成的矩阵。

假设有一个函数 $f(x_1, x_2, \dots, x_n)$ ，其 Hessian 矩阵 (H) 的元素是：

$H_{ij} = \frac{\partial^2 f}{\partial x_i \partial x_j}$

其中 $i$ 和 $j$ 是变量的索引，表示函数对变量 $x_i$ 和 $x_j$ 进行求导两次得到的结果。

Hessian 矩阵提供了函数局部极值的信息。在优化问题中，通过分析 Hessian 矩阵的特征值和特征向量，可以判断局部极值点的性质。比如：

当 Hessian 矩阵在某点是正定（所有特征值均为正），这个点是局部最小值点。
当 Hessian 矩阵在某点是负定（所有特征值均为负），这个点是局部最大值点。
当 Hessian 矩阵在某点的特征值有正有负，这个点是鞍点（saddle point）。

Hessian 矩阵在优化算法中的应用非常广泛，特别是对于牛顿法等利用二阶导数信息的算法。

考虑一个简单的二元函数：

$f(x, y) = x^2 + 2y^2$

这个函数的 Hessian 矩阵是：

$\begin{bmatrix} 2 & 0 \\ 0 & 4 \end{bmatrix}$

这个矩阵中的元素 $H_{ij}$ 表示函数对 $x_i$ 和 $x_j$ 的二阶偏导数。在这个例子中， $H_{11} = 2$ 、 $H_{22} = 4$ ，其余元素为零。

观察 Hessian 矩阵的特征值：

$\text{det}(H - \lambda I) = 0$

其中 $I$ 是单位矩阵， $\lambda$ 是特征值。解这个方程可以得到 Hessian 矩阵的特征值。

对于这个例子，特征值为 $\lambda_1 = 2$ 和 $\lambda_2 = 4$ ，都是正值，说明这个函数在原点附近是一个局部最小值点。这与我们对函数形式的了解是一致的，因为 $f(x, y) = x^2 + 2y^2$ 是一个沿着 x 方向开口朝上的二次型，所以原点是一个局部最小值点。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。