问题
ValueError: Expected more than 1 value per channel when training, got input size [1, x, x, x]
x是其他,关键在第一个1这里,例如batch里最后样本数不够时,还将其加载入如BatchNorm2d的模块中就会报错!!!
所以,有人的解决方案是,模型加载数据,采用选项 drop_last=True, 加载的batch都是完整的,但每轮会随机少一部分数据没看到。
我的选择是轻微改变一下训练batch_size的大小,在训练时就可以错开这个微妙的1. 这样的好处就是会保证训练到每个数据。
还有一个技巧是,把网络中存在报错可能的如BatchNorm2d的模块都屏蔽来进行,只要检测到这个报错维度,直接跳过。