深度学习随记

最新推荐文章于 2024-08-09 14:32:52 发布

qq_44066896

最新推荐文章于 2024-08-09 14:32:52 发布

阅读量46

点赞数

文章标签：深度学习 python 人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44066896/article/details/131013291

版权

文章讲述了在PyTorch中使用nn.DataParallel封装模型时，需要通过model.module访问真实模型的状态字典。在保存和加载模型时，应使用model.module.state_dict()。此外，还展示了如何加载预训练模型进行预测以及在微调过程中加载优化器的状态。

摘要由CSDN通过智能技术生成

当模型被封装在 nn.DataParallel 中时需要注意的

当模型被封装在 nn.DataParallel 中时，我们需要使用模型的 module 属性来获得真正的模型状态字典。（model.module.state_dict()）

torch.save(
    {
        "model": model.module.state_dict(),
        "optimizer": optimizer._optimizer.state_dict(),
    },
    os.path.join(
        train_config["path"]["ckpt_path"],
        "{}.pth.tar".format(step),
    ),
)

获取某一训练好的模型的输出的自定义方法

def get_speakermodel(mel):
    model = MultiTaskModel().to(device)
    ckpt_path = "/home/nicola/LA_SE/output/ckpt/300000.pth.tar"
    ckpt = torch.load(ckpt_path)
    model.load_state_dict(ckpt["model"])
    with torch.no_grad():
        s_id = model(mel)
    return s_id

微调

    model = FastSpeech2(preprocess_config, model_config).to(device)
    if train:
        ckpt_path = os.path.join(
            train_config["path"]["ckpt_path"],
            "{}.pth.tar".format(args.restore_step),
        )
        ckpt = torch.load(ckpt_path)
        scheduled_optim = ScheduledOptim(
            model, train_config, model_config, args.restore_step
        )
        if args.restore_step:    #将这一句注释掉或者设置为True就是微调了
            scheduled_optim.load_state_dict(ckpt["optimizer"])
        model.train()
        return model, scheduled_optim

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深度学习随记

当模型被封装在 nn.DataParallel 中时，我们需要使用模型的 module 属性来获得真正的模型状态字典。（model.module.state_dict()）
复制链接

扫一扫

博客等级

码龄6年

18
原创

3
点赞

4
收藏

2
粉丝

关注

私信

热门文章

分类专栏

最新评论

遍历文件夹下的文件
CSDN-Ada助手: 恭喜您开始博客创作，您的第一篇博客已经很不错了！我的建议是，您可以在这篇博客的基础上进一步探讨如何遍历文件夹下的子文件夹，或者分享一些实用的技巧和注意事项。期待您的下一篇精彩文章！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1 如果您持续创作，完成第三篇博客，并且质量分达到 80 分以上，在评论区就有机会获得红包奖励哦！
从content.txt中随机挑选文本并去除其空格和拼音后替换--text后双引号中的文本
CSDN-Ada助手: 恭喜您第十篇博客发表成功！您的创作精神值得我们学习。不过，我认为您可以尝试更深入的研究，例如在此基础上对文本进行情感分析或主题抽取，从而让读者更深入地了解您的文章。期待您更多的创作！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply10 看奖励名单。
两种加载gpu并将模型放置到gpu上的方式；python3.6之后的格式化字符方式
CSDN-Ada助手: 恭喜您写了这篇关于GPU加载和Python3.6格式化字符的博客！您的文章内容非常有用，对于想要学习GPU加速和Python编程的人来说都是很有帮助的。建议您可以继续分享一些关于Python的高级技巧和应用，这样可以让更多的人受益。期待您的下一篇文章！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply9 看奖励名单。
将文件名为该内容的文件移动到指定文件夹内
CSDN-Ada助手: 恭喜您撰写了这篇有用的博客，我觉得您的方法非常实用并且易于理解。我期待您未来更多的博客，特别是关于如何优化文件管理和组织的技巧。再次感谢您的分享！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply8 看奖励名单。
读取csv文件
CSDN-Ada助手: 非常感谢您的第七篇博客，标题为“读取csv文件”。您的文章对于读取csv文件的方法和技巧进行了详细的介绍，让读者受益匪浅。恭喜您一直保持着持续创作的热情和动力，这是一个非常值得赞赏的品质。接下来，我建议您可以探索更多与csv文件相关的主题，例如如何使用Python进行数据分析和可视化等。期待您的下一篇博客！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply7 看奖励名单。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。