李宏毅机器学习学习打卡Task05-网络设计的技巧篇

一、局部最小值与鞍点

1.局部最小值、局部最大值与鞍点
在这里插入图片描述
2.如何判断这三种情况?

根据泰勒展开可以得到右上角的公式,此时运用线性代数的知识求海塞矩阵的特征值进行判断即可。

在这里插入图片描述
3.碰到鞍点的解决方案

根据海塞矩阵的负特征值来更新梯度。

在这里插入图片描述
4.局部最小值其实并没有想象中那么多

达到梯度为0的地方,并不意味着没路继续往低处走。
从低维看是局部最小值,并不意味着在高维也是局部最小值。

在这里插入图片描述

梯度很小的时候可以是以下几种情况。

在这里插入图片描述

二、批次与动量

1.批次的优化
在这里插入图片描述
2.小批次和大批次的差异
在这里插入图片描述
3.动量的引入

更新梯度进一步考虑了上一步更新梯度的惯性。

在这里插入图片描述
在这里插入图片描述
4.总结
在这里插入图片描述

三、自动调整学习速率

1.不同的参数需要不同的学习率

如果用同一个学习率,会导致训练十分困难即使还没到局部最小值。

在这里插入图片描述
2.采用不同学习率的策略

分母:
(1)均方根
在这里插入图片描述 (2)RMSProp
在这里插入图片描述 在这里插入图片描述 分子 :
(3)学习率调度
在这里插入图片描述

3.总结

优化的三个调整方向如下式子。

在这里插入图片描述

四、分类问题及其损失函数

1.回归改为分类存在的问题

类别相似性存在问题。

在这里插入图片描述

使用ont-hot进行修复。

2.softmax

简单来说,softmax用来给onthot编码进行0-1区间化。

在这里插入图片描述
3.分类问题需要选交叉熵作为损失函数
在这里插入图片描述
在这里插入图片描述

用MSE会出现stuck的现象。

五、批次标准化

1.缩放的引入
在这里插入图片描述
2.为什么要批次标准化?
在这里插入图片描述
3.会出现ICS问题?
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值