【神经网络】权值初始化以及常见的激活函数对应的初始化方法（Pytorch)

最新推荐文章于 2023-06-16 18:02:01 发布

ZhuojunChen

最新推荐文章于 2023-06-16 18:02:01 发布

阅读量650

点赞数

分类专栏：神经网络文章标签：神经网络 pytorch

本文链接：https://blog.csdn.net/qq_39332551/article/details/117222455

版权

神经网络专栏收录该内容

8 篇文章 1 订阅

订阅专栏

权值初始化是搭建神经网络之后的重要步骤。适当的初始化可以加速模型的收敛，而不适当的初始化则会使梯度消失或爆炸，下面主要针对常见的激活函数简要介绍两种权值初始化方法。

Xavier 方法

该方法主要针对饱和激活函数如 sigmoid 和 tanh 等。pytorch中的调用语句为：

tanh_gain = nn.init.calculate_gain('tanh')
nn.init.xavier_uniform_(m.weight.data, gain=tanh_gain)

Kaiming 方法

该方法主要针对非饱和的激活函数如 ReLU等。pytorch中的调用语句为：

nn.init.kaiming_normal_(m.weight.data)

一个例子（用kaiming方法初始化一个全连接层的权值）：

 self.fc = nn.Linear(input_channels, hidden_channels) 
 nn.init.kaiming_normal_(self.fc.weight)

具体的原理和分析，参见这篇文章：
[PyTorch 学习笔记] 4.1 权值初始化

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

ZhuojunChen

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

【19】pytorch中的权值初始化方法

Clichong

09-15

911

以下内容来源于Pytorch官方文档与博主余霆嵩提供资料文章目录1. 常用的初始化方法1.1 均匀分布初始化（uniform_）1.2 正态分布初始化（normal_）1.3 常数初始化（constant_）1.4 一值初始化（ones_）1.5 零值初始化（zeros_）1.6 单位矩阵初始化（eye_）1.7 狄拉克初始化（dirac_）1.8 正交初始化（orthogonal_）1.9 稀疏初始化（sparse_）1.10 Xavier初始化1.10.1 Xavier均匀分布（xavier_un.

pytorch学习笔记九：权值初始化

Dear_learner的博客

02-21

2469

一、概念权值初始化是指在网络模型训练之前，对各节点的权值和偏置初始化的过程，正确的初始化会加快模型的收敛，从而加快模型的训练速度，而不恰当的初始化可能会导致梯度消失或梯度爆炸，最终导致模型无法训练。如上图所示的一个基本的CNN网络结构，数据在网络结构中流动时，会有如下的公式（默认没有偏置）：在反向传播的过程中，由于是复合函数的求导，根据链式求导法则，会有两组导数，一个是损失函数Cost对Z的导数，一个是损失函数对W的导数， 1、损失函数关于状态Z的梯度： 2、损失函数关于W的梯度：可以看出，

参与评论您还未登录，请先登录后发表或查看评论

pytorch 神经网络初始化方式

hello_program_world的博客

09-16

1025

神经网络的参数初始化和批量归一化 - Hiidiot - 博客园关于参数随机初始化问题的补充 - 知乎 pytorch中的参数初始化方法总结_ys1305的博客-CSDN博客_pytorch参数初始化

【学习笔记】pytorch中对神经网络模型中的参数进行初始化方法的几种方法 ——pytorch模型训练表现不佳, 很有可能是参数初始化的问题

KaelCui的博客

05-17

837

对于初始化基本概念不清楚的可以点击权值初始化的十种方法 Talking is cheap,please give me code! 方法一： from torch.nn import init # pytorch 中用于初始化的模块 #define the initial function to init the layer's parameters for the network def weigth_init(m): if isinstance(m, nn.Conv2d): # 如

权重初始化对于激活函数的选择：随机常态分布/随机正态分布初始化(标准差为0.01或1)、Xavier(Glorot)初始化、He初始化

あずにゃん梓喵的博客

08-19

2572

tensorflow 2.0 画出model网络模型的拓扑图 tensorflow 2.0 的回调函数callbacks（TensorBoard、ModelCheckpoint） TensorBoard视觉化网络每层权重分布、视觉化网络层结构 MSE(均方误差)、MAE(平均绝对误差) from_logits CE(Cross-Entropy)、BCE(Binary Cross-Ent...

[PyTorch]PyTorch中模型的参数初始化的几种方法（转）

急流勇进

12-08

4671

[PyTorch]PyTorch中模型的参数初始化的几种方法（转） ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~本文目录1. xavier初始化2. kaiming初始化3. 实际使用中看到的初始化3.1 ResNeXt，densenet中初始化3.2 wide-residual-networks中初始化（MSRin...

PyTorch 学习笔记（四）：激活函数对比、权重初始化、防止过拟合的方法

h__ang的博客

04-22

5486

一. 激活函数 如果不用激活函数，每一层输出都是上层输入的线性函数，无论神经网络有多少层，输出都是输入的线性组合。如果使用的话，激活函数给神经元引入了非线性因素，使得神经网络可以任意逼近任何非线性函数，这样神经网络就可以应用到众多的非线性模型中。 1. Sigmoid Sigmoid非线性函数的数学表达式是σ(x)=11+e−x\sigma (x)=\frac{1}{1+e^{-x}}σ(x)=1...

PyTorch 中常用的初始化神经网络权重的函数

最新发布

weixin_41168869的博客

06-16

325

这个方法是基于 Xavier Glorot 和 Yoshua Bengio 在他们的论文 “Understanding the difficulty of training deep feedforward neural networks” 中提出的启发式方法，旨在使初始化的权重分布更适合于反向传播算法，并提高模型的训练效果。在神经网络的训练过程中，权重的初始化对模型的收敛速度和泛化能力都有重要影响。: 将权重张量初始化为从正态分布中采样的随机值，并根据激活函数的特性对权重进行缩放。作为初始化的权重张量。

PyTorch学习—11.权值初始化

柳杰的博客

07-18

604

文章目录引言梯度消失与爆炸引言本节讲解权值初始化的必要性，首先分析神经网络中权值的方差过大导致梯度爆炸的原因，然后从方差一致性原则出发分析Xavier初始化方法与Kaiming初始化方法的由来，最后介绍pytorch提供的十种初始化方法。梯度消失与爆炸恰当的权值初始化可以加速收敛，不当的权值初始化会导致梯度爆炸或梯度消失，最终导致模型无法训练。下面我们了解不恰当的权值初始化是如何导致梯度消失与爆炸的？我们可以知道要避免梯度消失与爆炸，要严格控制网络输出层的输出值的尺度范围，使得每一层的

pytorch学习笔记十：权值初始化的十种方法

Dear_learner的博客

02-23

1856

在上一节中了解了为什么要进行权值初始化以及如何选择权值初始化方法，在这一节来了解一下pytroch中十种权值初始化方法一、权值初始化流程 1、先设定什么层用什么初始化方法，初始化方法在 torch.nn.init 中给出； 2、实例化一个模型之后，执行该函数，即可完成初始化。示例： def initialize_weights(self): for m in self.modules: # 对卷积层进行初始化 if isinstance(m, nn.Conv2d)

pytorch学习:初始化权重并对整个网络的参数进行初始化

CV_YOU的博客

08-09

1万+

pytorch的几种权重初始化方式: PyTorch提供了多种参数初始化函数： torch.nn.init.constant(tensor, val) torch.nn.init.normal(tensor, mean=0, std=1) torch.nn.init.xavier_uniform(tensor, gain=1) 上面的初始化函数的参数tensor，...

深度学习面试总结-3 权重初始化和激活函数

weixin_44351910的博客

09-08

426

权重初始化和激活函数

理解网络权重初始化（Pytorch）

码农1479的博客

04-07

1966

利用线性代数和概率基础知识理解神经网络权重初始化方法。

深度学习激活函数和权值初始化

CC_Lsh的博客

10-05

343

深度学习激活函数和权值初始化

Pytorch下训练神经网络，卷积核的初始权重设置

weixin_45288536的博客

06-28

5241

训练了一些网络，发现一个问题，怎样查卷积核的初始权重，以及初始权重是如何配置的？ 1.首先了解初始化的目的使得神经网络在训练过程中学习到有用的信息，这意味着参数的梯度能为0。那么参数初始化应该满足：各层激活值不会出现饱和现象；各层激活值不为0。 2.随机生成小的随机数我们将参数初始化为小的随机数。其中randn从均值为0，标准差是1的高斯分布中取样。需要注意的是参数初始值不能取得太小，因为小的参数在反向传播时会导致小的梯度，对于深度网络来说，也会产生梯度消失问题，降低参数的收敛速度。 3.Pytorch

Pytorch 实现强化学习策略梯度Reinforce算法

qq_43571752的博客

05-30

2235

公式推导这里参考邱锡鹏大佬的《神经网络与深度学习》第三章进阶模型部分，链接《神经网络与深度学习》。 ` 核心代码 def main(): env = gym.make('CartPole-v0') obs_n = env.observation_space.shape[0] act_n = env.action_space.n logger.info('obs_n {},act_n {}'.format(obs_n, act_n)) model = Pgne

深度学习Pytorch入门：神经网络模型的参数初始化操作

PingBryant的博客

11-30

2949

本文重点其实如果我们使用 pytorch 封装好的网络层的时候,我们并不需要对模型的参数初始化,因为这些都是 pytorch 帮助我们完成的,但是如果我们自己搭建模型(不使用 pytorch 中的封装好的网络层)或者对 pytorch 中封装好的模型初始化参数不满意,那么此时我们对模型进行参数初始化。用 pytorch 已经封装好的层来搭建网络模型 import torch import numpy as np from torch import nn class Simple_net(nn.Modu

Pytorch 模型初始化

m0_43395719的博客

08-12

8274

在开始阅读下面的内容之前，我们需要牢记参数初始化的目的是为了让神经网络在训练过程中学习到有用的信息，这意味着参数梯度不应该为0。而我们知道在全连接的神经网络中，参数梯度和反向传播得到的状态梯度以及入激活值有关——激活值饱和会导致该层状态梯度信息为0，然后导致下面所有层的参数梯度为0；入激活值为0会导致对应参数梯度为0。所以如果要保证参数梯度不等于0，那么参数初始化应该使得各层激活值不会出现饱和现象且激活值不为0。我们把这两个条件总结为参数初始化条件： 初始化必要条件一：各层激活值不会出现饱和现象。 初始化必

pytorch中的参数初始化方法