pytorch_权值初始化

最新推荐文章于 2021-08-31 00:25:34 发布

LGDDDDDD

最新推荐文章于 2021-08-31 00:25:34 发布

阅读量802

点赞数

分类专栏： pytorch

本文链接：https://blog.csdn.net/weixin_43289424/article/details/104245572

版权

pytorch 专栏收录该内容

13 篇文章 0 订阅

订阅专栏

权值初始化

梯度消失与爆炸

梯度消失与爆炸

梯度爆炸

在这里插入图片描述
要使网络输出不能太大不能太小

初始化网络权值方差

为了使输出方差为1，将网络权值的方差设为

    def initialize(self):
        for m in self.modules():
            if isinstance(m, nn.Linear):
                nn.init.normal_(m.weight.data, std=np.sqrt(1/self.neural_num))    # normal: mean=0, std=1

梯度消失

若输出加入激活函数，会使网络层的输出层数据越来越小，从而导致梯度消失

Xavier初始化（适用饱和函数）

在这里插入图片描述

Kaiming初始化（适用于非饱和）

在这里插入图片描述

十种初始化方法

在这里插入图片描述

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

LGDDDDDD

关注关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
pytorch_权值初始化

权值初始化梯度消失与爆炸梯度爆炸初始化网络权值方差梯度消失Xavier初始化（适用饱和函数）Kaiming初始化（适用于非饱和）十种初始化方法梯度消失与爆炸梯度爆炸要使网络输出不能太大不能太小初始化网络权值方差为了使输出方差为1，将网络权值的方差设为 def initialize(self): for m in self.modules(): ...
复制链接

扫一扫