【Datawhale X 李宏毅苹果书 AI夏令营】向李宏毅学深度学习(进阶) 笔记

最新推荐文章于 2024-08-27 17:12:24 发布

deardeer7

最新推荐文章于 2024-08-27 17:12:24 发布

阅读量531

点赞数 9

分类专栏：人工智能文章标签：人工智能深度学习笔记

本文链接：https://blog.csdn.net/qq_43471354/article/details/141569538

版权

人工智能专栏收录该内容

1 篇文章 0 订阅

订阅专栏

背景

在第五期，Datawhale开源项目孵化的《深度学习详解》新书发布之际，通过《深度学习详解》和李宏毅老师 21年的机器学习课程视频，学习/复习一下深度学习的理论。

《深度学习详解》主要内容源于《机器学习》（2021年春），选取了《机器学习》（2017年春）
的部分内容，在这些基础上进行了一定的原创，补充了不少除这门公开课之外的深度学习相关知识。

为了尽可能地降低阅读门槛，笔者对这门公开课的精华内容进行选取并优化，对所涉及的公式都给出详细的推导过程，对较难理解的知识点进行了重点讲解和强化，以方便读者较为轻松地入门。

在理论严谨的基础上，本书保留了公开课中大量生动有趣的例子，帮助读者从生活化的角度理解深度学习的概念、建模过程和核心算法细节，包括——

卷积神经网络、Transformer、生成模型、自监督学习（包括 BERT 和 GPT）等深度学习常见算法，
对抗攻击、领域自适应、强化学习、元学习、终身学习、网络压缩等深度学习相关进阶算法。

Task 1

开营直播：AI学习路线
学习深度学习基础：局部极小值与鞍点（文字 + 视频）
学习深度学习基础：批量和动量（文字 + 视频）

Task 1.1 学习深度学习基础：局部极小值与鞍点

局部极小值与鞍点

局部极小值（local minimum）

局部极小值直观的看，其所在区域呈凹陷口袋形状，局部极小值周围的点都比其要大，做深度学习时使用梯度下降收敛在局部极小值，梯度为零，这时候假如往四周走，loss都会升高。

鞍点（saddle point）

鞍点顾名思义，这个点所在的区域呈马鞍形状，从上图可以看出，鞍点在一个方向上为区域最小值，无法继续优化；但在另一个方向上却是区域最大值，仍存在优化空间。虽然鞍点的梯度也为零，但它不是局部极小值。

应用

梯度为零的点统称为临界点（critical point）。训练优化走到临界点的时候，首先要判读这个临界点到底是局部极小值还是鞍点，如果损失收敛在局部极小值，所在的位置已经是损失最低的点了，往四周走损失都会比较高，就没有路可以走了；但如果是鞍点，旁边还是有路可以让损失更低的，只要逃离鞍点，就有可能让损失更低。