每日一问之鞍点（saddle point）

最新推荐文章于 2025-03-22 08:52:42 发布

caoqi95

最新推荐文章于 2025-03-22 08:52:42 发布

阅读量6.2k

点赞数 2

分类专栏：每日一问文章标签：深度学习每日一问

本文链接：https://blog.csdn.net/weixin_39993648/article/details/86775258

版权

每日一问专栏收录该内容

9 篇文章

订阅专栏

今天开始在 GitHub 上刷每日一题，但是很快就被一道题卡住了。题目如下所示：

结合自己的情况并针对这道问题，整理出了以下概念：

什么是鞍点？
什么是 Hessian 矩阵？
如何证明一个点为鞍点？
局部最小值和鞍点的区别？

什么是鞍点

在维基中的定义如下：

In mathematics, a saddle point or minimax point is a point on the surface of the graph of a function where the slopes (derivatives) in orthogonal directions are all zero (a critical point), but which is not a local extremum of the function.

在数学中，鞍点或极小值点是函数图形表面上的一个点，其正交方向上的斜率(导数)均为零(临界点)，但不是函数的局部极值。一句话概括就是：

一个不是局部极值点的驻点称为鞍点。

*驻点：函数在一点处的一阶导数为零。

如下图所示，是函数 z = x² - y² 图像，其鞍点在 (0, 0) 位置。函数 z 的整个曲面看上去就像是一个马鞍，其在 x 轴方向向上曲，在 y 轴方向向下曲。所以这也是鞍点这个名字的由来。

附上一张吴恩达大大的画作，哈哈。

什么是 Hessian 矩阵

在维基中的定义如下：

In mathematics, the Hessian matrix or Hessian is a square matrix of second-order partial derivatives of a scalar-valued function, or scalar field. It describes the local curvature of a function of many variables.

在数学中，Hessian 矩阵是标量值函数或标量场函数的二阶偏导数的方块矩阵。它描述了许多变量函数的局部曲率，可以用于判定多元函数的极值。假设有一实数函数 f: Rⁿ→ R ，是关于输入 x (x ∈ Rⁿ) 及输出 f(x) ∈ R 之间的关系式。如果其所有的二阶偏导数都存在，并且在该函数的领域上连续，那么 Hessian 矩阵 H 是一个 n×n 的矩阵，通常如下定义：