MXNet模型参数的访问、初始化和共享

本文介绍了如何在MXNet中访问、初始化和共享模型参数。首先讲解了模型参数的访问流程,接着详细阐述了参数的初始化过程,包括默认初始化方法。然后讨论了如何自定义初始化方法以满足特定需求。最后,文章探讨了在多个层或模型之间共享参数以优化性能和减少内存消耗的策略。
摘要由CSDN通过智能技术生成

模型参数的访问:

# 通过net后面括号内的索引访问哪一层
net[0].params, type(net[0].params)
# 两种方法得到相应层的信息,一般使用后者,因为前者需要输入层的名称(权重和偏差)
net[0].params['dense0_weight'], net[0].weight
# 层包括了data和grad,即权重和梯度
net[0].weight.data()
net[0].weight.grad()
net[0].bias.data()

# 得到所有层的信息
net.collect_params()
# 通过正则表达式筛选需要的参数
net.collect_params('.*weight')

初始化模型参数:

# 使用默认初始化方式
net.initialize()  

# 使用init.initialize里的方法初始化
# 非首次对模型初始化需要指定force_reinit为真
net.initialize(init=init.Normal(sigma=0.01), force_reinit=True) # 正态分布初始化
net.initialize(init=init.Constant(1), force_reinit=True) # 常数初始化
# 特定层的参数进行初始化
net[0].weight.initialize(init=init.Xavier(), force_reinit=True) # Xavier随机初始化

自定义初始化方法:

# 通过继承init.Initializer,重载构造函数
class M
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值