Datawhale X 李宏毅苹果书 AI夏令营深度学习（进阶）方向 Task02 学习笔记

他们都说有手就行

于 2024-08-31 23:29:24 发布

阅读量104

点赞数 5

文章标签：人工智能深度学习学习

本文链接：https://blog.csdn.net/m0_74485136/article/details/141760904

版权

在深度学习的实际应用中，优化模型参数以提高性能和减少误差是至关重要的。Task2涵盖了几种高级的优化策略，包括自适应学习率、不同的优化算法以及实践操作。

自适应学习率方法根据每个参数的更新历史自动调整其学习率，提高了优化的灵活性和效率。

AdaGrad
- 原理：AdaGrad通过累积每个参数的梯度平方和来调整学习率，适合处理稀疏数据。
- 优点：对于不同频率的特征自动调整学习率。
- 缺点：学习率持续减小，可能过早降低至非常小的值，导致学习停滞。
RMSProp
- 改进：引入衰减系数解决AdaGrad学习率持续下降的问题，使得学习率在必要时可以保持一定的大小。
Adam
- 结合：Adam算法结合了Momentum和RMSProp的优点，不仅依赖于一阶矩估计（梯度的指数加权平均）也利用了二阶矩估计（梯度平方的指数加权平均）。
学习率调度
- 策略：根据训练进度动态调整学习率，如预热、指数衰减等，有助于模型在训练后期稳定收敛。

分类是深度学习中的常见任务，涉及将实例分配到预定义的类别。

损失函数
- 交叉熵损失：测量预测概率分布与实际分布之间的差异，是分类问题中最常用的损失函数。
激活函数
- Softmax：将模型输出的原始分数转换为概率分布。
- Sigmoid：在二分类中与Softmax等价，用于输出概率预测。

关注

Datawhale X 李宏毅苹果书 AI夏令营 深度学习（进阶）方向 Task02 学习笔记