pytorch学习之权值初始化

正在进步的小李

已于 2023-07-17 16:28:39 修改

阅读量89

点赞数

分类专栏： pytorch框架文章标签： pytorch 学习人工智能

于 2023-07-17 16:28:07 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_72955351/article/details/131768326

版权

pytorch框架专栏收录该内容

9 篇文章 0 订阅

订阅专栏

权值初始化

当搭建好模型之后，就会遇见权值初始化，良好的初始化能够让模型更好的收敛。如果初始化不合适的话，容易出现梯度爆炸或者消失，而无法很好的训练

针对这个问题提出了一系列的初始化方法

`Xavier`初始化

方差一致性：保持数据尺度维持在恰当的范围，通常方差为1

这类初始化方法是针对的饱和函数，如：sigmoid、Tanh

Understanding the difficulty of training deep feedforward neural networks

def initialize(self):
	for m in self.modules():
		if isinstance(m, nn.Linear):

			# 计算数据输送到激活函数中标准差的变化，即激活函数增益

			tanh_gain = nn.init.calculate_gain('tanh')  
			nn.init.xavier_uniform_(m.weight.data, gain=tanh_gain)

其中nn.init.calculate_gain

主要功能：计算激活函数的方差变化尺度

主要参数：

nonlinearity：激活函数名称
param：激活函数的参数，如Leaky ReLu的negative_slop

`Kaiming`初始化

当激活函数变成ReLU之后，Xavier初始化就不再适用了。针对这个问题何凯明大神提出了Kaiming初始化

方差一致性：保持数据尺度维持在恰当范围，通常方差为1

激活函数：ReLU及其变种

Delving Deep into Rectifiers:
Surpassing Human-Level Performance on ImageNet Classification

nn.init.kaiming_normal_(m.weight.data)

正在进步的小李

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
pytorch学习之权值初始化

pytorch权值初始化学习记录
复制链接

扫一扫

专栏目录

正在进步的小李 CSDN认证博客专家 CSDN认证企业博客

码龄2年

20: 原创

141万+: 周排名

179万+: 总排名

1594: 访问

: 等级

221: 积分

1: 粉丝

0: 获赞

13: 评论

1: 收藏

私信

关注

热门文章

分类专栏

最新评论

语法学习（一）
CSDN-Ada助手: 恭喜您写了第三篇博客！标题为“语法学习（一）”。您的坚持和创作热情令人钦佩。在这篇博客中，您似乎开始探索语法学习的奥秘，这是一个非常重要的主题，对于提高语言表达能力至关重要。接下来，我建议您可以继续深入探讨语法学习的其他方面，例如不同语法规则的应用场景、常见语法错误的纠正方法等。谦虚地说，我相信您对语法学习有更多独到见解。期待您的下一篇博客！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
VGG网络
CSDN-Ada助手: 恭喜您写下了第5篇博客！标题为“VGG网络”，看来您对深度学习的研究和实践非常扎实。在这篇博客中，您对VGG网络进行了详尽的介绍，为读者提供了宝贵的知识。不过，如果我可以提供一些建议的话，或许您可以在下一篇博客中探讨一下VGG网络在图像分类任务中的应用案例，这将进一步丰富您的内容，使读者更好地理解和应用VGG网络。期待您未来更多的博客创作，谢谢您的分享！
GooLeNet V1 网络学习
CSDN-Ada助手: 恭喜您撰写了第10篇博客！标题中的“GooLeNet网络学习”引起了我的兴趣。您对网络学习的深入研究令人敬佩。在下一步的创作中，或许您可以考虑加入一些实例或案例，以便更好地说明GooLeNet在网络学习中的应用。我相信您的谦虚态度将会让您不断进步，期待您未来更多的精彩博文！
GoogleNet V2
CSDN-Ada助手: 恭喜你撰写了第11篇博客，标题为“GoogleNet V2”！你的持续创作精神令人钦佩。在这篇博客中，你提到了GoogleNet的第二版，这无疑是一个引人注目的主题。下一步，我建议你可以进一步探索GoogleNet V2的创新之处，比如其在图像识别领域的应用以及与之前版本的对比。同时，也可以讨论一下GoogleNet V2相对于其他深度学习模型的优势和不足之处。期待你在未来的创作中继续保持谦虚态度，为读者带来更多有价值的内容！
GoogLeNet V3
CSDN-Ada助手: 恭喜您撰写了第12篇博客，题为“GoogLeNet V3”。您对于持续创作的热情令人钦佩，这表明您对该主题的深入理解和扎实的知识储备。在接下来的创作中，我建议您考虑探讨一些与GoogLeNet V3相关的实践案例或者对该模型的进一步改进。期待在您的博客中继续学习到更多有价值的知识。谦虚的态度将使您的博客更具魅力，同时也会吸引更多读者的关注。加油！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。