1. bug内容
RuntimeError: Unable to find a valid cuDNN algorithm to run convolution
2. 解决办法
设置
torch.backends.cudnn.benchmark = True
加上这一行后bug解决了,而且训练还更快了(但是在不同硬件下可能情况不同,因为我在本地电脑机上这样设置后训练更慢了,但是在服务器上更快了)
其他
而且这样设置后悔导致GPU的利用率和内存使用率都增加。影响中设置前GPU Memory-Usage大概在28000M左右