pytorch默认初始化_Pytorch：参数初始化笔记

最新推荐文章于 2023-04-10 20:48:21 发布

weixin_39520775

最新推荐文章于 2023-04-10 20:48:21 发布

阅读量1.9k

点赞数 1

文章标签： pytorch默认初始化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39520775/article/details/111822770

版权

本文介绍了PyTorch中各种权重初始化方法，包括默认初始化、均匀分布、高斯分布、常量填充、主对角线填充、狄拉克δ函数、Xavier和Kaiming初始化。这些方法对神经网络的训练效果有着重要影响。通过For循环和Apply函数可以方便地对模型权重进行初始化。

摘要由CSDN通过智能技术生成

一、参数初始化概述

在设计好神经网络结构之后，权重初始化方式会很大程度上影响模型的训练过程和最终效果。

权重初始化方式包括ImageNet预训练参数，kaiming_uniform方式以及多种权重初始化方式。这篇笔记主要记录一下Pytorch中内置的各种权重初始化方式的原理与使用。

神经网络中需要进行参数初始化操作的有Linear，Conv，BN等。

二、Pytorch中的参数初始化方法

2.1 不进行初始化操作，系统的默认初始化方法(来源于pytorch0.4源码)

Conv{1,2,3}d 都是继承于_ConvNd，其中对于参数的默认初始化方法如下:

def reset_parameters(self):

n = self.in_channels

for k in self.kernel_size:

n *= k

stdv = 1. / math.sqrt(n)

self.weight.data.uniform_(-stdv, stdv)

if self.bias is not None:

self.bias.data.uniform_(-stdv, stdv)

Linear

def reset_parameters(self):

stdv = 1. / math.sqrt(self.weight.size(1))

self.weight.data.uniform_(-stdv, stdv)

if self.bias is not None:

self.bias.data.uniform_(-stdv, stdv)

BN{1,2,3}d 都是继承于_BatchNorm，其中对于参数的默认初始化方法如下:

def reset_parameters(self):

self.reset_running_stats()

if self.affine:

self.weight.data.uniform_()

self.bias.data.zero_()

2.2 torch.nn.init.uniform_(tensor, a=0, b=1)

使用均匀分布U(a,b)初始化Tensor，即Tensor的填充值是等概率的范围为 [a，b) 的值。均值为 (a + b)/ 2.

w = torch.empty(2, 3)

最低0.47元/天解锁文章

weixin_39520775

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
pytorch默认初始化_Pytorch：参数初始化笔记

一、参数初始化概述在设计好神经网络结构之后，权重初始化方式会很大程度上影响模型的训练过程和最终效果。权重初始化方式包括ImageNet预训练参数，kaiming_uniform方式以及多种权重初始化方式。这篇笔记主要记录一下Pytorch中内置的各种权重初始化方式的原理与使用。神经网络中需要进行参数初始化操作的有Linear，Conv，BN等。二、Pytorch中的参数初始化方法2.1 不进行初始...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。