关于pytorch中drop_last的提醒，不同类别数据不均衡时使用drop_last=True会导致模型训练结果很差

最新推荐文章于 2024-08-21 15:44:31 发布

yimi~

最新推荐文章于 2024-08-21 15:44:31 发布

阅读量9.4k

点赞数 6

文章标签： python 深度学习 pytorch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42940160/article/details/123894759

版权

在使用PyTorch进行图像分类时，遇到因类别数据量不均衡（第1516类训练集仅15个）导致drop_last=True时测试准确率为0的问题。解决办法是调整drop_last为False，确保所有数据参与训练。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

项目场景：

我在使用pytorch进行图像分类的时候。
我的解决办法对于我而言很有效，你可以把我的结论当作一种参考

问题描述

遇到了这样的问题。一共16类，第15 16类的训练集数量是15、15，测试集分别为14、5。其他1-14类训练集分别有50个，测试集均为200左右。

当我在pytorch的dataloader中设置了drop_last=True时，无论怎么训练，使用怎么样的数据增强，第15 16类才测试集上的准确率永远为0.

原因分析：

当dataloader设置了drop_last=True时，在训练时如果数据总量无法整除batch_size，那么这个dataloader就会丢掉最后一个batch，也就是说训练的时候有部分数据是被丢掉的。而我遇到的情况可能是正好把第15 16类的测试数据给丢掉了部分，导致模型很好的学习到这两类的特征。

解决方案：

将drop_last改为False，即可解决该问题。

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。