这几天在使用pytorch的时候训练网络总是会出现这个问题Process finished with exit code -1073741819 (0xC0000005),定位过问题代码后发现是下面这一句出错了:
loss.backward()
一直没有找出具体的原因,后来发现只要去掉这句话就可以正常运行,但是网络要训练肯定没办法去掉,另外一个就是可以去掉model.cuda()和data.cuda(),也就是说只要使用cuda在gpu上运行就会报错,故猜测是cuda的原因,本机安装的是cuda9.2+cudnn7.0,所以将cuda卸载重装了cuda10.1+cudnn7.0问题解决,可能是之前安装的cuda哪个地方出问题导致的。特此记录下,防止将来遇到。
网上也有关于这个问题的解决方案,比较全面:
https://blog.csdn.net/qiao1025566574/article/details/81037908
但是我都不是,所以只能自己另外找原因了。