权重初始化和激活函数小结

最新推荐文章于 2024-07-20 06:19:20 发布

笔写落去

最新推荐文章于 2024-07-20 06:19:20 发布

阅读量542

点赞数 13

分类专栏：深度学习文章标签：深度学习机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_55383558/article/details/135405556

版权

深度学习专栏收录该内容

9 篇文章 0 订阅

订阅专栏

本文章参考李沐老师的动手深度学习,作为个人的笔记.

4.8. 数值稳定性和模型初始化 — 动手学深度学习 2.0.0 documentation (d2l.ai)

文章目录

首先我们理想的神经网络是什么样子的?

一.权重初始化

二.检查激活函数

前言

选择合理的权重初始化和选择合理的激活函数在训练是保证训练的稳定性尤为重要,本文介绍其做法,帮助我们事半功倍.

首先我们理想的神经网络是什么样子的?

这样的一个神经网络对于我们来说才是很好的,并且我们要达到这样的要求我们要做什么呢?

一.权重初始化

在合理值区间例随机初始参数.
训练开始得时候更容易有数值不稳定.

远离最优解的地方损失函数的表面可能很复杂.
最优解附近表面会比较平

使用N(0,0.01)来初始可能对小网络没有问题,但不能保证深度神经网络.

这里放一个图帮助大家理解.

二.检查激活函数

上述公式表明我们的激活函数必须是f(x) = x 在零附近可以近似的看作是f(x) = x,而且神经网络的权重通常是在零点附近比较小的数,所以tanh(x)与relu(x)是可以满足我们要求的,而sigmoid函数不满足,但可以进行平移变换来将函数调整.

总结

梯度消失和梯度爆炸是深度网络中常见的问题。在参数初始化时需要非常小心，以确保梯度和参数可以得到很好的控制。
需要用启发式的初始化方法来确保初始梯度既不太大也不太小。
ReLU激活函数缓解了梯度消失问题，这样可以加速收敛。
随机初始化是保证在进行优化前打破对称性的关键。
Xavier初始化表明，对于每一层，输出的方差不受输入数量的影响，任何梯度的方差不受输出数量的影响。

关注

13
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
0
评论
权重初始化和激活函数小结

选择合理的权重初始化和选择合理的激活函数在训练是保证训练的稳定性尤为重要,本文介绍其做法,帮助我们事半功倍.梯度消失和梯度爆炸是深度网络中常见的问题。
复制链接

扫一扫

专栏目录

笔写落去 CSDN认证博客专家 CSDN认证企业博客

码龄3年

43: 原创

110万+: 周排名

10万+: 总排名

4万+: 访问

: 等级

964: 积分

403: 粉丝

500: 获赞

26: 评论

586: 收藏

私信

关注

热门文章

分类专栏

最新评论

Java实现五子棋小游戏(附思路讲解,全部代码,游戏截图)
2302_82216537: 字体重叠怎么办什么设置的问题
diamond数据集探索及可视化Python
小百事.: coef = data.corr() coef 请问为什么我的热力图它会把'cut'和'color'搞进去，然后报错不能转换为float。而您的并没有尝试把cut和color弄进热力图里。
深度学习进行数据增强(实战篇)
征途黯然.: 深度学习进行数据增强实战篇文章非常出色，真的很棒。
数据结构及单链表例题(下)
白话机器学习: 写的非常详细，是一篇优质博客，干货满满，让我有了全新的认识，感谢博主分享，让我学到了很多，支持支持。
数据结构二叉树创建及例题(上)
白话机器学习: 写的非常详细，是一篇优质博客，干货满满，让我有了全新的认识，感谢博主分享，让我学到了很多，支持支持。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

笔写落去 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。