错误如下:
return super(Tensor, self).split(split_size, dim)
RuntimeError: start (0) + length (0) exceeds dimension size (0).
在pytorch多卡训练时,遇到的bug。感觉在网上没有说清楚的。
而我出现这个错误的是因为加入了一批新的数据,而这个报错不告诉你错误在哪一张图,难!
我怎么找到问题的呢?
二分法拆分新的数据,在只剩余50张图时,终于看到其中数据的不同:
对!其中有一张图是横过来的,因此输入的图像的tensor shape 不对。去掉这张图,训练一切正常。