对于这个问题,有几种情况,有的说显卡炸了,关闭一些实验性功能即可;
有的说是因为输入了空向量,这个不大应该吧。
我昨天遇到了这个报错,背景是用了交叉验证,代码多次精确的在第二个epoch的最后一个batch报错,我猜测是批次问题,就给交叉验证的剩余批次丢弃了,如标红部分。就不报错了。
原因引自花书,在于批量规范化层(batch normalization)需要在完整小批量上执行,而不是像其他层一样可以忽略批量。一个批次只存在一个样本或者不完整的样本个数应该会报错。
train_loader = DataLoader(train_subset, batch_size=BATCH_SIZE, shuffle=True,drop_last=True)
val_loader = DataLoader(val_subset, batch_size=BATCH_SIZE, shuffle=False,drop_last=True)
pytorch 报错:RuntimeError: CUDA error: invalid configuration argument
最新推荐文章于 2024-08-06 21:31:41 发布