深度学习笔记 DatawhaleX李宏毅苹果书 AI夏令营

最新推荐文章于 2024-09-28 21:20:29 发布

l__111

最新推荐文章于 2024-09-28 21:20:29 发布

阅读量572

点赞数 24

文章标签：笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/l__111/article/details/141651004

版权

3.3 自适应学习率

临界点：在训练神经网络时，损失函数可能陷入局部最小值或鞍点，导致梯度下降停滞。
梯度范数：即使损失不再下降，梯度范数（梯度的向量长度）仍然可能很大，表明并未真正达到临界点。
自适应学习率：为每个参数定制不同的学习率，以克服梯度下降中的不足。

3.3.1AdaGrad

定义：AdaGrad（Adaptive Gradient）是一种典型的自适应学习率方法，根据梯度的大小自动调整学习率。
公式：
$\theta _{t+1}^{i}$ $\leftarrow$ $\theta _{t}^{i}$ - $\frac{\eta }{\delta _{0}^{i}}g_{0}^{i}$
其中， $g_{t}^{i}$ 是第 t 次迭代时参数 i 的梯度， $\delta _{t}^{i}$ 是过去所有梯度平方的平均值（均方根）。
特点：梯度大时减小学习率，梯度小时增加学习率。

3.3.2 RMSProp

背景：RMSprop 是一种由 Geoffrey Hinton 提出的自适应学习率方法，未正式发表，但广泛用于实践中。
公式：
$\delta _{i}^{t}= \alpha \left (\delta _{i}^{t-1} \right )^{2}+\left ( 1-\alpha \right )\left ( g_{i}^{t} \right )^{2}$
其中，α 是一个超参数，用于调整旧梯度和新梯度的重要性。
特点：能够动态调整学习率，适应误差表面的变化。

3.3.3Adam

定义：Adam（Adaptive moment estimation）结合了 RMSprop 和动量法，是目前最常用的优化器之一。
特点：
- 使用动量作为参数更新方向。
- 能够自适应调整学习率。
- PyTorch等框架内置了Adam优化器，并提供了预设的超参数。

3.4 学习率调度

定义：学习率调度（Learning Rate Scheduling）是指学习率随时间变化的策略。
常见策略：
- 学习率衰减（Learning Rate Decay）：随着训练的进行，逐渐减小学习率。
- 预热（Warmup）：在训练初期，先以较小的学习率收集信息，然后逐渐增大学习率。

示例分析

AdaGrad优化问题：在某些情况下，AdaGrad可能导致学习率累积过大，通过学习率调度可以修正这一问题。
学习率衰减效果：结合学习率衰减，可以更平滑地收敛到最优解。

3.5 优化总结

最终公式：
其中， $m_{t}^{i}$ 是动量项，ηt 是随时间变化的学习率。
变形与优化器：各种优化器主要区别在于计算 mit 和 σit 的方式，以及学习率调度的策略。

3.6 分类

3.6.1 分类与回归的关系

回归：输入一个向量 x，输出预测值 y^，目标是让 y^ 尽可能接近真实标签 y。
分类：可视为一种特殊的回归，但输出采用独热向量表示不同类别，避免类别间的预设关系问题。
独热向量：每个类别对应一个向量，向量长度为类别总数，其中只有一个元素为1(表示该类别），其余元素为0。
- 示例：类别1为[1,0,0]^T，类别2为[0,1,0]^T，类别3为[0,0,1]^T。

3.6.2 带有softmax的分类

softmax函数：用于将网络输出 y^ 归一化为概率分布 y′。
- 公式：
- 作用：将任意实数值映射到(0,1)区间，并保证所有输出元素的和为1，同时放大较大值与较小值之间的差距。

3.6.3 分类损失

损失函数：衡量预测输出 y′ 与真实标签 y 之间的差异。
- 均方误差（MSE）：e= $\sum_{i}^{}\left ( y_{i} -y_{i}^{}{}'\right )^{2}$
- 交叉熵（Cross-Entropy）：e=− $\sum_{i}^{}y_{i}^{}lny_{i}{}'$
为什么选择交叉熵：
- 交叉熵在输出接近目标时梯度较大，有助于模型快速收敛。
- 交叉熵与最大似然估计等价，具有更好的统计解释。

关注

24
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。