pytorch系列 -- 9 pytorch nn.init 中实现的初始化函数 uniform, normal, const, Xavier, He initialization

最新推荐文章于 2023-12-07 11:44:54 发布

墨氲

最新推荐文章于 2023-12-07 11:44:54 发布

阅读量6.1w

点赞数 126

分类专栏： pytorch 记录 python3 pytorch0.4系列教程文章标签： pytorch nn.init xavier He

本文链接：https://blog.csdn.net/dss_dssssd/article/details/83959474

版权

本文介绍了PyTorch中的权重初始化方法，包括均匀分布、正太分布、常数初始化，详细讲解了Xavier和He初始化的原理及应用场景，特别是针对ReLU激活函数的He初始化在深度学习中的重要性。

摘要由CSDN通过智能技术生成

本文内容：
1. Xavier 初始化
2. nn.init 中各种初始化函数
3. He 初始化

torch.nn.init.uniform_(tensor, a=0, b=1)
服从~ $U (a, b)$

torch.nn.init.normal_(tensor, mean=0, std=1)
服从~ $N (m e a n, s t d)$

torch.nn.init.constant_(tensor, val)
初始化整个矩阵为常数val

基本思想是通过网络层时，输入和输出的方差相同，包括前向传播和后向传播。具体看以下博文：

所以论文提出，在每一层网络保证输入和输出的方差相同。
2. xavier初始化的简单推导
https://blog.csdn.net/u011534057/article/details/51673458

对于Xavier初始化方式，pytorch提供了uniform和normal两种：

关注

专栏目录