权值初始化的常用方法

一壶浊酒..

已于 2022-09-01 23:16:12 修改

阅读量778

点赞数 2

分类专栏： # pytorch 文章标签：算法人工智能机器学习

于 2022-09-01 23:15:18 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40107571/article/details/126653027

版权

pytorch 专栏收录该内容

56 篇文章 3 订阅 ¥39.90 ¥99.00

订阅专栏

权重初始化对于深度神经网络的训练至关重要，它可以防止梯度消失或梯度爆炸问题，确保模型输出的稳定性。本文介绍了Xavier、kaiming等初始化方法，包括均匀分布和正态分布策略，并探讨了不同类型的层如何选择合适的初始化方式。

摘要由CSDN通过智能技术生成

为什么要进行权值初始化

深度神经网络经常会遇到梯度消失或者梯度爆炸现象。为什么会出现这种现象呢？熟悉链式求导法则的大家都知道，梯度是一些量的连乘，这些当中最重要的就是模型的输出。如果这时，模型的输出过大或者过小，将会导致梯度过大或过小（神经元死亡）。而控制模型输出的大小，跟模型的输入和模型的参数有关。所以从这个角度来看，我们是希望模型的输出是比较稳定的（也就是输出的方差比较稳定）。当然，也有其他方面的原因。比如说，如果模型的参数初始化刚好在模型最优解的附近，那么模型的优化将变得十分简单。

权值初始化的例子

def initialize_weights(self):
    for m in self.modules:
        # 对卷积层进行初始化
        if isinstance(m, nn.Conv2d):
            torch.nn.init.xavier_normal_(m.weight.data)
            if m.bias is not None:
                m.bias.data.zero_()
                
        # 对BN层进行初始化
        elif isinstance(m, nn.BatchNorm2d):
            m.weight.data.fill_(1)
            m.bias.data.ze

了解本专栏

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

一壶浊酒.. CSDN认证博客专家 CSDN认证企业博客

码龄7年

466: 原创

9363: 周排名

5554: 总排名

45万+: 访问

: 等级

5321: 积分

1432: 粉丝

587: 获赞

73: 评论

1433: 收藏

私信

关注

热门文章

分类专栏

最新评论

Python logging模块的基本使用
北风之神c: 总结的很全面，写得赞，博主用心了。此国产日志 https://nb-log-doc.readthedocs.io/zh_CN/latest 使用原生 loggng封装，兼容性和替换性100%,大幅简化logging的使用。 1、日志能根据级别能够自动变彩色。 1 2、print自动变彩色。 3、日志和print在pycahrm控制台的输出都自动可以点击跳转到文件和行号。 4、多进程日志切割安全，文件日志写入性能高。 5、入参简单，能一键自动记录到多种地方。 6、 nb_log 兼容包含loguru色彩模式,loguru只是nb_log的子集之一. 相比 loguru 有10胜。 pip install nb_log 。
python Canny边缘检测
白社会社长: 第二步好像没有用到sobel算子，这是为什么呢？
paddle 自定义数据集和预处理
NEVER GIVE UP198: 为什么我安装paddle装不上
数据结构和算法
人间无解: 非常欣赏博主的博客，每一篇都充满了智慧和深度。博主文笔流畅自然，能够轻松驾驭复杂的技术话题，将其转化为通俗易懂的语言。同时，您还善于结合实践经验和前沿技术，为我们提供了宝贵的参考和启示。每次阅读您的博客，我都能从中获得新的启发和收获，三连支持博主创作出更加优秀的文章，要是博主能对我的文章指点一下更好了，非常感谢大佬对我的帮助和支持！
Python logging模块的基本使用
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

一壶浊酒.. 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。