关于PyTorch中模型保存与加载的问题

最新推荐文章于 2022-12-01 10:22:49 发布

南京黑芝麻浆

最新推荐文章于 2022-12-01 10:22:49 发布

阅读量470

点赞数

文章标签： pytorch 深度学习人工智能

本文链接：https://blog.csdn.net/weixin_58303981/article/details/127418190

版权

博主分享了在模型加载、数据转换和梯度爆炸问题上的经验，包括模型保存与nn.Flatten/torch.flatten的区别，以及未归一化导致的预测偏差。他还揭示了解决导入代码自动训练的方法和重要细节调整。

摘要由CSDN通过智能技术生成

我真服了，明明这么简单的东西，居然卡了我一个晚上，哭死

1.模型保存与加载推理的问题

代码如下，很简单，直接用既保持模型，又保存checkpoints的就好了，虽然不推荐，但是简单啊！

torch.save(SncNet, 'final.pth')

model = torch.load("best.pth")

2.关于nn.Flatten()与torch.flatten()（懒得写了，如下图所示）

由于我的模型是全部由全连接层构成，输入数据是4*3，因此网络第一层必然是nn.Flatten()，但是nn.Flatten()出现在网络的定义中，因此它是对于第一维度的拉伸，反之，torch.flatten()是对于第零维度的拉伸。因此要想输入一个4*3的数据去已保存的模型中，首先第一步是需要把他reshape成1*4*3的格式，或者在网络输入输入的时候直接将数据输入成1*12的格式。

3.在做预测模型的时候，出现了预测出全是0和1的情况，很显然是因为经过了sigmoid之后，梯度爆炸，导致最后两极分化，如下图所示，这是我经过断点之后，查看sigmoid之前的数据，发现产生了梯度爆炸（谢谢我的彬神，告诉我该怎么debug呜呜呜），但是再训练的时候看输出明明好好的，所以问题肯定出在了数据导入，紧接着就发现，我忘记对数据做归一化，导致梯度爆炸！！！