损失函数优化失败,可能是因为局部最小,也有可能是因为马鞍点。
损失函数L斯塔,可以用附近点的损失函数表示。g是梯度函数,H是海森函数。
critical point是临界点。此时梯度g为0。
H的特征值全都大于0时,此时斯塔点为局部最小点。
H的特征值全都小于0时,此时斯塔点为局部最大点。
否则为马鞍点。
输入为1,输出也为1。由海森矩阵求出特征值。可以判断,权重参数为0,0时,此点为马鞍点。
如何解决马鞍点呢。取一个负特征值,求出对应的特征向量。
局部最小,局部最大,马鞍点。
于 2022-04-18 21:01:55 首次发布