Pytorch基础知识整理（六）参数初始化

最新推荐文章于 2024-05-27 09:20:53 发布

Brikie

最新推荐文章于 2024-05-27 09:20:53 发布

阅读量529

点赞数

分类专栏：随笔·各种知识点整理文章标签：深度学习

本文链接：https://blog.csdn.net/Brikie/article/details/112219572

版权

随笔·各种知识点整理专栏收录该内容

18 篇文章 4 订阅

订阅专栏

参数初始化的目的是限定网络权重参数的初始分布，试图让权重参数更接近参数空间的最优解，从而加速训练。pytorch中网络默认初始化参数为随机均匀分布，设定额外的参数初始化并非总能加速训练。

1，模板

在训练开始对指定层的权重或偏置初始化：

def weight_init(m):
    if isinstance(m, (nn.Conv2d, nn.Linear)):
        nn.init.kaiming_normal_(m.weight)
    elif isinstance(m, nn.BatchNorm2d):
        m.weigth.data.fill_(1)
        m.bias.data.zero_()
    
model.apply(weight_init)

2，pytorch自带的参数初始化方法

torch.nn.init.
uniform(tensor, a=0, b=1) 均匀分布，下限a，上限b
normal(tensor, mean=0, std=1)正态分布
constant(tensor, val)常数值
xavier_uniform(w, gain=math.sqrt(2.0))
xavier_normal(tensor, gain=1)
kaiming_uniform(tensor, a=0, mode=‘fan_in’)
kaiming_normal(tensor, a=0, mode=‘fan_in’)
orthogonal(tensor, gain=1)正交矩阵

Brikie

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Pytorch基础知识整理（六）参数初始化

参数初始化的目的是限定网络权重参数的初始分布，试图让权重参数更接近参数空间的最优解，从而加速训练。pytorch中网络默认初始化参数为随机均匀分布，设定额外的参数初始化并非总能加速训练。1，模板在训练开始对指定层的权重或偏置初始化：def weight_init(m): if isinstance(m, (nn.Conv2d, nn.Linear)): nn.init.kaiming_normal_(m.weight) elif isinstance(m, nn.Bat
复制链接

扫一扫