在运行一个非常简单的深度学习程序的时候,发现运行一段时间会报错 段错误
经过定位发现是执行loss.backward()的时候出现的问题,而源码明显是没有什么问题的。
具体排查可以这样:
gdb --args python train.py
然后发现这个问题是存在pytorch内部的,而不是自己写的逻辑有问题。注:这个torch版本是1.8.0, 执行其他程序没有明显报错。
更新到1.10.0版本就可以解决segmentation fault的问题。
在运行一个非常简单的深度学习程序的时候,发现运行一段时间会报错 段错误
经过定位发现是执行loss.backward()的时候出现的问题,而源码明显是没有什么问题的。
具体排查可以这样:
gdb --args python train.py
然后发现这个问题是存在pytorch内部的,而不是自己写的逻辑有问题。注:这个torch版本是1.8.0, 执行其他程序没有明显报错。
更新到1.10.0版本就可以解决segmentation fault的问题。