【李宏毅2021机器学习深度学习】 神经网络训练不起来怎么办?

文章目录

写在前面

[视频学习-bilibili] | [课程主页——sample code & slide] | [ML2021学习笔记]

神经网络训练不起来怎么办?

【2-2】04_Local Minimum And Saddle Point(Saddle Point不可怕,Local Minimum 几乎不可能遇到,在高维度上看就不是Local Minimum 了)

特征值有正有负是Saddle Point, 全正局部最小,全负局部最大
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

local minimal 很少,几乎不可能遇到(在更高的维度上看,local minimal可能就不是local minimal了)

在这里插入图片描述
在这里插入图片描述

【2-3】05_Batch and Momentum(训练技巧)

Batch

在这里插入图片描述
在这里插入图片描述

big batch_size 时间并不比 small batch_size 多,因为并行计算,跑完一个epoch大的batch_size update次数少

在这里插入图片描述
在这里插入图片描述

smaller batch size has better performance(更有差异)

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

鱼和熊掌兼得?(既想large batchsize 的快,又想small batchsize的optimization)

在这里插入图片描述

Momentum

在这里插入图片描述

在这里插入图片描述

总结(cirtical points 是梯度为0的点不好更新,smaller batch size 和 momentum能有效解决)

在这里插入图片描述

【2-4】06_Adaptive Learning Rate

loss不再下降,可能不是local minimal(极少遇到几乎不考虑),而是学习率太大反复横跳,太小梯度无法更新

在这里插入图片描述
在这里插入图片描述

Adam最常用(用pytorch默认的参数 效果 就很好了)

在这里插入图片描述

Learning Rate Scheduling(学习率随时间变化,有Decay和Warm up(黑科技))

在这里插入图片描述

Warm up(黑科技,学习率先上升后下降,直观的解释是:先探索每个方向,再走下去)

在这里插入图片描述
在这里插入图片描述
为什么需要Warm up,请参考
在这里插入图片描述

小结:Summary of Optimization

在这里插入图片描述

【2-5】08_Classification - 损失函数(Loss)也可能有影响

在这里插入图片描述
在这里插入图片描述

Softmax

在这里插入图片描述
在这里插入图片描述

loss of classfication(Cross-entropy)

过去上课有讲证明,Classification讲两个多小时,21年简化了精简了。。。

在这里插入图片描述

改变loss function 就可以改变optimization的难度

在这里插入图片描述

【2-6】07_Batch Normalization

如果输入的x很小,w也很小,乘起来也就很小。
在这里插入图片描述

尽量loss不要变得椭圆,难train

在这里插入图片描述

Feature Normalization

在这里插入图片描述

BN(Feature Normalization只对第一层的input处理,那么第二层的呢?第三层…?引出BN)

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

Batch Normalization的batch要够大

在这里插入图片描述
在这里插入图片描述

Batch Normalization —— Testing

在这里插入图片描述

BN的实验结果:加快训练速度(BN推平了error surface,所以learing rate能够调大一点)

在这里插入图片描述

为什么BN会好呢?

在这里插入图片描述
在这里插入图片描述

其他的Normalization

在这里插入图片描述

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值