MXNet模型参数的延后初始化

最新推荐文章于 2022-09-09 12:18:20 发布

Fronzy

最新推荐文章于 2022-09-09 12:18:20 发布

阅读量446

点赞数

分类专栏：深度学习-李牧学习笔记文章标签： MXNet 模型延后初始化

本文链接：https://blog.csdn.net/zhangyugebb/article/details/101617262

版权

学习笔记同时被 2 个专栏收录

37 篇文章 0 订阅

订阅专栏

深度学习-李牧

25 篇文章 12 订阅

订阅专栏

模型的延后初始化

先看下面这段代码：

from mxnet import init, nd
from mxnet.gluon import nn

class MyInit(init.Initializer):
    def _init_weight(self, name, data):
        print('Init', name, data.shape)
        # 实际的初始化逻辑在此省略了
        
net = nn.Sequential()
net.add(nn.Dense(256, activation='relu'),
        nn.Dense(10))
    
net.initialize(init=MyInit())

这里虽然调用了initialize方法对模型net进行初始化，但是实际上初始化过程并没有进行。

只有当我们做了一次前向传播，模型才进行初始化：

X = nd.random.uniform(shape=(2, 20))
Y = net(X)

并且这个初始化过程只在第一次前向计算的时候被调用，并且在第一次前向传播之前我们无法使用data函数和set_data函数来获取和修改参数。

避免延后初始化

1.对已经初始化的模型进行重新初始化的时候，因为参数形状不会发生变化，所以系统能够立即进行重新初始化

net.initialize(init=MyInit(), force_reinit=True)

2.在创建层的时候指定它的输入个数

net = nn.Sequential()
net.add(nn.Dense(256, in_units=20, activation='relu')) # in_units置顶输入个数
net.add(nn.Dense(10, in_units=256))

net.initialize(init=MyInit())

为什么模型要进行延后初始化呢？

答：主要是为了让模型的构造更加简单。例如，我们无须人工推测每个模型的输入个数（尤其层数多的时候，不推测直接写也很麻烦）

Fronzy

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
MXNet模型参数的延后初始化

模型的延后初始化先看下面这段代码：from mxnet import init, ndfrom mxnet.gluon import nnclass MyInit(init.Initializer): def _init_weight(self, name, data): print('Init', name, data.shape) # 实...
复制链接

扫一扫

专栏目录