torch.nn.init中常用的几种方法

最新推荐文章于 2025-03-11 22:44:52 发布

breezehasai

最新推荐文章于 2025-03-11 22:44:52 发布

阅读量1.5k

点赞数 1

文章标签： pytorch

本文链接：https://blog.csdn.net/breezehasai/article/details/120490253

版权

从均匀分布U(a, b)中生成值，填充输入的张量或变量

# 服从 U(a, b)
torch.nn.init.uniform(tensor, a=0, b=1)
w = torch.Tensor(3, 5)
print nn.init.uniform(w)

从给定均值和标准差的正态分布N(mean, std)中生成值，填充输入的张量或变量

# 服从 N(mean,std)
torch.nn.init.normal(tensor, mean=0, std=1)
w = torch.Tensor(3, 5)
print torch.nn.init.normal(w)

用单位矩阵来填充2维输入张量或变量。在线性层尽可能多的保存输入特性

torch.nn.init.eye(tensor)
w = torch.Tensor(3, 5)
# 生成单位矩阵
print torch.nn.init.eye(w)

使用值val填充输入Tensor或Variable 。

# 将值始化值为val
torch.nn.init.constant(tensor, val)
w = torch.Tensor(3, 5)
# 生成一个三行五列值全为2的tensor
print torch.nn.init.constant(w,2)

xavier

torch.nn.init.xavier_uniform_(tensor, gain=1)
这里有一个gain，增益的大小是依据激活函数类型来设定
xavier初始化方法中服从均匀分布U(−a,a)
分布的参数
在这里插入图片描述
torch.nn.init.xavier_normal_(tensor, gain=1)
xavier初始化方法中服从正态分布N(mean=0, std)