ValueError: Expected more than 1 value per channel when training, got input size torch.Size([1, 2048

最新推荐文章于 2023-03-08 15:29:19 发布

海的白帆

最新推荐文章于 2023-03-08 15:29:19 发布

阅读量1.4k

点赞数

本文链接：https://blog.csdn.net/weixin_43925119/article/details/109755329

版权

在多块GPU上训练模型时，出现如下错误：
在这里插入图片描述
看很多博客说是：
模型使用了batchnomolization，batchnorm层需要大于一个样本去计算其中的参数，训练中用batch训练的时候当前batch恰好只含一个sample，而由于BatchNorm操作需要多于一个数据计算平均值，因此造成该错误。解决方法是将dataloader的一个丢弃参数设置为true。
在这里插入图片描述于是查看我的训练batch_size=16,
训练集样本：7058
验证集样本：1000
测试集样本：2015
计算了一下均没有剩下一个样本的情况，而且我的数据读入也不是通过DataLoader，保险起见，试了下将数据集的样本数都改为16的倍数，于是便可以运行了。