动手学深度学习

本文探讨了深度学习中遇到的梯度爆炸和梯度消失问题,这两个问题与数值稳定性密切相关。梯度爆炸可能导致参数值过大,对学习率敏感,需要精细调整;而梯度消失则阻碍深层网络的训练。解决方法包括使用ReLU等稳定激活函数,保持输入输出方差一致,以及寻找合适的初始化策略。此外,优化学习率的选择也是关键,需要在训练过程中动态调整以保证模型的收敛。
摘要由CSDN通过智能技术生成

,,## 14

数值稳定性

在这里插入图片描述
在这里插入图片描述

梯度爆炸的问题

  1. 超出值域 (16位浮点数尤为严重)
  2. 对学习率敏感
    如果学习率太大-大参数值(大权重)-更大的梯度(梯度就是权重的乘法)-更大的参数值
    如果学习率太小-训练无进展
    需要在训练过程不断调整学习率
    学习率可能只有在很小的范围才是好的

梯度消失
当sigmoid函数的输入很大或是很小时,它的梯度都会消失。 此外,当反向传播通过许多层时,除非我们在刚刚好的地方, 这些地方sigmoid函数的输入接近于零,否则整个乘积的梯度可能会消失。 当我们的网络有很多层时,除非我们很小心,否则在某一层可能会切断梯度。 事实上,这个问题曾经困扰着深度网络的训练。 因此,更稳定的ReLU系列函数已经成为从业者的默认选择。

梯度值变为0(16位浮点数尤为严重)
训练没有进展(不管如何选择学习率)
对于底部层尤为严重,仅仅顶部层训练的比较好,无法让神经网络更深

核心目标:让训练更加稳定-梯度不要太大也不要太小
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
远离最优解的地方比较陡,梯度比较大。
最优解附近比较平,梯度比较小
在这里插入图片描述

期望即均值
在这里插入图片描述
因为均值为0,所以第二项为0,只需要考虑第一项
第一项的展开
在这里插入图片描述
因为w与h独立同分布,且均值为0,所以此项为0
在这里插入图片描述
期望可加
在这里插入图片描述
在这里插入图片描述
由于两个的均值都等于0,因此由公式:方差等于平方的期望减去的期望和
在这里插入图片描述
可将期望变为方差
在这里插入图片描述
由于
在这里插入图片描述
为第t层输入的个数,第t-1层的输出个数(神经元个数)在这里插入图片描述
最后可以得到在这里插入图片描述
我们希望var[hit]=var[hjt-1],输入的方差等于输出的方差
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
激活函数需要过原点
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 《动手深度学习 v2》是一本介绍深度学习的教材,通过动手实践的方式帮助读者深入理解深度学习的理论和实践。这本书由李沐等人共同编写,内容包含了深度学习的基本概念、算法原理以及实际应用等方面。 这本书的优点之一是注重实践,通过大量的案例和代码实现,读者可以亲自动手搭建深度学习模型,并通过实际操作来理解算法的工作原理。此外,书中还涵盖了一些最新的深度学习技术和应用,帮助读者跟上深度学习领域的最新发展。 《动手深度学习 v2》也具有一定的难度,对于初者来说需要一定的数和编程基础才能更好地理解和实践。但是,书中的难点都有详细的解答和说明,读者可以在遇到困难时查看相关解析,提升习效果。 总的来说,《动手深度学习 v2》是一本非常实用的深度学习教材,适合有一定基础的读者习和实践。通过阅读这本书,读者可以系统地深度学习的基本概念和算法,掌握如何应用深度学习解决实际问题,进而在深度学习领域有更深入的理解和应用。 ### 回答2: 《动手深度学习 v2》pdf是一本深度学习入门的教程,适合初深度学习的理论和实践。这本教程由作者李沐、阿斯顿·张剑锋等人合作撰写,涵盖了深度学习的基本概念、神经网络的构建、常见深度学习模型、计算机视觉、自然语言处理等领域的应用。 这本教程的特点是注重实践,每个章节都提供了大量的代码示例和实验指导,让读者可以动手实践,巩固所知识。同时,教程还配有相应的代码库和数据集,读者可以下载使用。 教程通过讲解深度学习的基本概念和原理,帮助读者建立起对深度学习的整体认识。然后,通过实例演示和实践,教会读者如何使用深度学习框架搭建神经网络,并进行训练和优化。 另外,这本教程也介绍了一些常见的应用领域,如计算机视觉和自然语言处理。读者可以习到如何使用深度学习来解决图像分类、目标检测、文本生成等问题。 最后,这本教程还提供了一些深度学习的进阶内容,如深度生成模型和强化习等,供读者深入习和拓展。 总的来说,《动手深度学习 v2》pdf是一本很好的深度学习入门教程,通过动手实践和实例演示,帮助读者快速入门和掌握深度学习的基本知识和应用技巧。对于想要深度学习的初者来说,是一本非常有价值的教材。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值