4. 类神经网络训练不出来怎么办（一）Local minima 、Saddle point

Shannnon_sun

已于 2023-01-05 10:37:49 修改

阅读量155

点赞数

分类专栏：李宏毅机器（深度）学习笔记文章标签：神经网络深度学习

于 2023-01-05 10:35:10 首次发布

本文链接：https://blog.csdn.net/weixin_53451004/article/details/128559050

版权

李宏毅机器（深度）学习笔记专栏收录该内容

9 篇文章 0 订阅

订阅专栏

类神经网络训练不出来怎么办（一）

梯度为0

Local minima
Saddle point

两种可能情况，统称为：critical point

怎么知道是Local minima还是Saddle point?

给定 $L(\theta),\theta=\theta^{'}$

在 $\theta^{'}$ 附近： $L(\theta)\approx L(\theta^{'})+(\theta-\theta^{'})^Tg+\frac{1}{2}(\theta-\theta^{'})^TH(\theta-\theta^{'})$

g: Gradient H: Hessian matrix

当g 等于0时， $L(\theta)\approx L(\theta^{'})+\frac{1}{2}(\theta-\theta^{'})^TH(\theta-\theta^{'})$ H正定：Local minima H负定： Local maxima H不定：Saddle point

当是一个Saddle point时，可以根据H判断更新方向使Loss继续下降：

设 $u$ 是H特特征值为 $\lambda<0$ 的特征向量， $u^THu=\lambda||u||^2<0$ ，当 $\theta-\theta^{'}=u$ 时， $L(\theta)\approx L(\theta^{'})+\frac{1}{2}\lambda ||u||^2$

所以 $L(\theta)<L(\theta^{'})$ ，即沿 $u$ 方向移动可以使Loss变小 $\theta=\theta{'}+u$

Saddle point VS. Local minima

经验上看Local minima并不是很常见

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Shannnon_sun

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

【ML】类神经网络训练不起来怎么办 5

格物致知

03-27

1025

RMSProp 算法首先计算每个参数的均方根，然后用均方根来调整每个参数的学习率。如果一个参数的梯度变化幅度很大，那么它的均方根也会很大，从而导致它的学习率降低。反之，如果一个参数的梯度变化幅度很小，那么它的均方根也会很小，从而导致它的学习率提高。Small Batch v.s. Large Batch：详细的优势掠食对比，在并行情况下，速度持平，除非，大的batch特别大。RMSProp 算法可以有效解决 Adagrad 算法的学习率衰减过快的问题，并且在许多机器学习任务中都取得了良好的效果。

【学习笔记】李宏毅2021春机器学习课程第2.1节：局部最小值(local minima)与鞍点(saddle point)

Harryline的博客

07-11

1265

【学习笔记】李宏毅2021春机器学习课程第2.1节：局部最小值(local minima)与鞍点(saddle point) Critical Point 我们常常在做Optimization的时候发现，随着参数不断update，loss不会再下降，但是我们对这个loss仍然不满意，有时候我们甚至会发现一开始我们的模型就训练不起来。过去常见的一个猜想，是因为我们现在走到了一个地方，这个地方参数对loss的微分为0，这时gradient descent就没有办法再更新参数了，所以loss当然就不会再下降了。

参与评论您还未登录，请先登录后发表或查看评论

神经网络训练不起来怎么办？（一）局部最小值（Local minima）与鞍点(saddle point)

m0_59199033的博客

04-28

1821

critical point指的是鞍点（saddle point）和局部最优点（local minima），当训练不起来时候可能是此时梯度（gradient）为0训练不起来了，此时可能遇到了critical point。那么如何判断遇到的是saddle point还是local minima呢？根据上面的这个公式，计算（H）Hessian的值，当他为正时为则为local minima 当它为负值时为local minima，当它时为正，时而为负时，那么它就是saddle point.

2-2 李宏毅2021春季机器学习教程-类神经网络训练不起来怎么办（一）局部最小值与鞍点（Local Minima and Saddle Point）

csdn_xmj的博客

11-21

1369

When gradient is small 现在我们要讲的是Optimization的部分，等下我们要讲的东西基本上跟Overfitting没有什么太大的关联，我们只讨论Optimization的时候，怎么把gradient descent做得更好，那为什么Optimization会失败呢？

Critical Point ( local minima && saddle point)

like_jmo的博客

08-19

1026

Critical Point ( local minima && saddle point)

【深度学习】02-02-类神经网络训练不起来怎么办?(局部最小值local minima & 鞍点saddle point)-李宏毅老师21&22深度学习课程笔记

星辰不问

06-16

532

【深度学习】02-02-类神经网络训练不起来怎么办?(局部最小值local minima & 鞍点saddle point)-李宏毅老师21&22深度学习课程笔记

(一)神经网络训练不起来怎么办：局部最小值(local minia)与鞍点(saddle point)

m0_37957160的博客

12-14

2859

1、局部最小值(Local minima)与鞍点(saddle point) 所谓的saddle point其实就是gradient是零，但是不是local minima，也不是local maxima；比如下面的saddle point，他在左右方向上是比较高的，前后的方向上是比较高的，他是一个马鞍的形状，所以叫做saddle point；像saddle point这种地方，他也是gradient为零，但他不是local minima，像这种gradient为0的点统称为critical po.

李宏毅《机器学习》笔记 神经网络训练不起来怎么办

m0_53371353的博客

11-23

448

深度学习

7.类神经网络训练不起来怎么办（一）局部最小值与鞍点

与或

04-11

546

视频链接 7. 类神经网络训练不起来怎么办（一）局部最小值与鞍点 gradient为零的点统称为critical point 局部最小值：local minima 鞍点：saddle point loss没办法在下降也许是因为卡在了critical point 为什么要分辨？如果是local minima 那可能就没有路可以走了，如果是saddle point 还是有路可以走的，使loss更低。如何分辨到底是卡在local minima 还是 saddle point？ L (θ) lo

8.类神经网络训练不起来怎么办（二）batch and momentum

与或

04-11

336

视频链接 8 类神经训练不起来怎么办(二)批次与动量批次：batch 动量：momentum 两个有可能可以对抗 saddle point 或local minima 的技术。 Batch 拿一个batch的资料拿出来算loss，所有的batch 看过一遍叫一个epoch shuffle（洗牌）有很多不同的做法，常见的做法是在每一次epoch开始之前会分一次batch，每一个epoch的batch都不一样。为什么要用batch？（带着问题往下读）左边没有用batch的，要把所有的资料都看过一遍，

李宏毅8月深度学习类神经网络训练不起来怎么办Task05打卡

wkywcd的博客

08-26

211

目录一、如何辨认梯度为0是处于jubu二级标题三级标题四级标题五级标题六级标题一、如何辨认梯度为0是处于jubu 二级标题三级标题四级标题五级标题六级标题

神经网络训练不起来怎么办---李宏毅《机器学习》笔记05

ppsswhite的博客

08-25

504

文章目录一、局部最小值与鞍点二、使用步骤1.引入库2.读入数据总结一、局部最小值与鞍点示例：pandas 是基于NumPy 的一种工具，该工具是为了解决数据分析任务而创建的。二、使用步骤 1.引入库代码如下（示例）： import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import warnings warnings.filterwarnings('ignore'

李宏毅 4 神经网络训练不起来怎么办

mushroom_yogurt的博客

05-25

403

https://speech.ee.ntu.edu.tw/~hylee/ml/2021-spring.php 1. local minima and saddle point 局部最优和鞍点 https://speech.ee.ntu.edu.tw/~hylee/ml/ml2021-course-data/small-gradient-v7.pdf local minima: 微分为零 saddle point: critical point 微分为零根据泰勒展开公式，一次求导为0后可以看二次求导，判断

深度学习神经网络笔记--卷积神经网络

qq_62678349的博客

10-11

1248

深度学习-神经网络学习笔记----卷积神经网络一览

机器学习与神经网络：物理学的新边疆

u013818406的博客

10-11

624

2024年诺贝尔物理学奖的颁发，无疑是对机器学习和神经网络领域研究者的巨大认可。这一决定不仅标志着机器学习与神经网络在科学界的重要地位，也预示着这两个领域在物理学研究中将扮演越来越重要的角色。在这篇文章中，我将探讨机器学习和神经网络的发展前景，以及它们与传统物理学的关系。

【机器学习与神经网络荣获诺贝尔奖】科学边界的扩展及技术革新