常见的深度学习参数初始化方法总结

目录

1 随机初始化

2 Xavier初始化

3 He初始化

4 高斯随机初始化 with Batch Norm

5 Pre-train

Reference


在这里插入图片描述

1 随机初始化

 

2 Xavier初始化

每层的权重初始化公式如下
在这里插入图片描述
上式为一个均匀分布,n_j为输入层的参数,n_(j+1)为输出层的参数

Xavier的推导过程是基于几个假设的,

其中一个是激活函数是线性的,这并不适用于ReLU,sigmoid等非线性激活函数;

另一个是激活值关于0对称,这个不适用于sigmoid函数和ReLU函数它们不是关于0对称的。

3 He初始化

Xavier初始化没有考虑激活函数,在某些非线性激活函数上表现不好(大部分激活函数都是有效的),如Relu。因此针对Relu推导了一次,与上面过程类似,只是方差要除以2。

每层的权重初始化公式如下:
在这里插入图片描述
为一个均值为0方差为2/n的高斯分布。

4 高斯随机初始化 with Batch Norm

 

5 Pre-train

在实际训练中,我们可以选择一个backbone网络,在其基础上做改动。该网络如果有一个已经训练好的在任务A上的模型(称为pre-trained model),可以直接将其放在任务B上做模型调整(称为fine-tuning)。

 

Reference

深度学习-六种权重初始化

一文详解深度学习参数初始化(weights initializer)策略

  • 3
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值