pytorch_权值初始化

梯度消失与爆炸

梯度爆炸

在这里插入图片描述
要使网络输出不能太大不能太小
在这里插入图片描述

初始化网络权值方差

为了使输出方差为1,将网络权值的方差设为

    def initialize(self):
        for m in self.modules():
            if isinstance(m, nn.Linear):
                nn.init.normal_(m.weight.data, std=np.sqrt(1/self.neural_num))    # normal: mean=0, std=1

梯度消失

若输出加入激活函数,会使网络层的输出层数据越来越小,从而导致梯度消失

Xavier初始化(适用饱和函数)

在这里插入图片描述

Kaiming初始化(适用于非饱和)

在这里插入图片描述

十种初始化方法

在这里插入图片描述
在这里插入图片描述

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值