踩坑日记：pytorch模型训练train模式和eval模式结果相差甚远？

最新推荐文章于 2024-05-23 12:38:51 发布

皮皮他有他的皮

最新推荐文章于 2024-05-23 12:38:51 发布

阅读量3.5k

点赞数 4

文章标签： pytorch 深度学习 transformer

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39353767/article/details/122806501

版权

如我在文中对相关术语和概念的描述错误或不准确，欢迎评论区指正！谢谢～

参考博文：
Pytorch 查看模型参数_happyday_d的博客-CSDN博客_pytorch查看模型参数

https://www.jb51.net/article/189288.htm

最近在利用pytorch进行transformer模型训练的时候发现，明明训练的时候loss已经降到非常低、在调试模式下结果也十分理想，在测试集上生成的结果却非常离谱，无论是分类结果还是回归结果都不符合预期，以下通过整个调试过程阐述产生这种现象可能的原因，希望能够帮到你：
【本文运行环境：ubuntu16.04 + vscode 语言：python】

1、排查训练的模型加载是否有问题：
最直观的方式是将加载进来的模型权重参数打印出来看一看，正常情况下只要模型路径正确且模型确实成功加载了，在两种模式下的权重参数应该没有区别。

for parameters in net.parameters():
    print(parameters)

2、模型调参和反复训练尝试：<

最低0.47元/天解锁文章

皮皮他有他的皮

关注

4
点赞
踩
7

收藏

觉得还不错? 一键收藏
2
评论
踩坑日记：pytorch模型训练train模式和eval模式结果相差甚远？

如我在文中对相关术语和概念的描述错误或不准确，欢迎评论区指正！谢谢～最近在利用pytorch进行transformer模型训练的时候发现，明明训练的时候loss已经降到非常低、在调试模式下结果也十分理想，在测试集上生成的结果却非常离谱，...
复制链接

扫一扫

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。