常见的深度学习参数初始化方法总结

最新推荐文章于 2025-03-25 17:47:05 发布

一枚小码农

最新推荐文章于 2025-03-25 17:47:05 发布

阅读量3k

点赞数 3

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_25394043/article/details/104127522

版权

深度学习专栏收录该内容

8 篇文章

订阅专栏

目录

1 随机初始化

2 Xavier初始化

4 高斯随机初始化 with Batch Norm

在这里插入图片描述

1 随机初始化

2 Xavier初始化

每层的权重初始化公式如下：
在这里插入图片描述
上式为一个均匀分布，n_j为输入层的参数，n_(j+1)为输出层的参数

Xavier的推导过程是基于几个假设的，

其中一个是激活函数是线性的，这并不适用于ReLU，sigmoid等非线性激活函数；

另一个是激活值关于0对称，这个不适用于sigmoid函数和ReLU函数它们不是关于0对称的。

3 He初始化

Xavier初始化没有考虑激活函数，在某些非线性激活函数上表现不好（大部分激活函数都是有效的），如Relu。因此针对Relu推导了一次，与上面过程类似，只是方差要除以2。

每层的权重初始化公式如下：
在这里插入图片描述
为一个均值为0方差为2/n的高斯分布。

4 高斯随机初始化 with Batch Norm

5 Pre-train

在实际训练中，我们可以选择一个backbone网络，在其基础上做改动。该网络如果有一个已经训练好的在任务A上的模型（称为pre-trained model），可以直接将其放在任务B上做模型调整（称为fine-tuning）。

Reference

深度学习-六种权重初始化

一文详解深度学习参数初始化(weights initializer)策略

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。