深度学习随记

文章讲述了在PyTorch中使用nn.DataParallel封装模型时,需要通过model.module访问真实模型的状态字典。在保存和加载模型时,应使用model.module.state_dict()。此外,还展示了如何加载预训练模型进行预测以及在微调过程中加载优化器的状态。
摘要由CSDN通过智能技术生成

当模型被封装在 nn.DataParallel 中时需要注意的

当模型被封装在 nn.DataParallel 中时,我们需要使用模型的 module 属性来获得真正的模型状态字典。(model.module.state_dict())

torch.save(
    {
        "model": model.module.state_dict(),
        "optimizer": optimizer._optimizer.state_dict(),
    },
    os.path.join(
        train_config["path"]["ckpt_path"],
        "{}.pth.tar".format(step),
    ),
)

获取某一训练好的模型的输出的自定义方法

def get_speakermodel(mel):
    model = MultiTaskModel().to(device)
    ckpt_path = "/home/nicola/LA_SE/output/ckpt/300000.pth.tar"
    ckpt = torch.load(ckpt_path)
    model.load_state_dict(ckpt["model"])
    with torch.no_grad():
        s_id = model(mel)
    return s_id

微调

    model = FastSpeech2(preprocess_config, model_config).to(device)
    if train:
        ckpt_path = os.path.join(
            train_config["path"]["ckpt_path"],
            "{}.pth.tar".format(args.restore_step),
        )
        ckpt = torch.load(ckpt_path)
        scheduled_optim = ScheduledOptim(
            model, train_config, model_config, args.restore_step
        )
        if args.restore_step:    #将这一句注释掉或者设置为True就是微调了
            scheduled_optim.load_state_dict(ckpt["optimizer"])
        model.train()
        return model, scheduled_optim
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值