Segmentation fault 的bug解决

最新推荐文章于 2024-03-27 15:53:49 发布

Alexa2077

最新推荐文章于 2024-03-27 15:53:49 发布

阅读量1.1k

点赞数

分类专栏： Bug 文章标签： bug

本文链接：https://blog.csdn.net/Alexa_/article/details/134066403

版权

3 篇文章 0 订阅

订阅专栏

一，Segmentation fault 的bug解决

问题描述：自己在使用CPU上调试完代码之后，可以稳定运行，有输出结果。但是把数据和模型加载上GPU之后，出现了报错。
Segmentation fault (core dumped)

搜了一下可能存在的原因：

内存问题：深度学习模型通常需要大量的内存。如果你的模型太大，而 GPU 内存不足以容纳模型和数据，就会导致内存溢出，从而引发 Segmentation Fault。确保你的 GPU 具有足够的内存来处理你的模型和数据
不稳定的模型结构：有时，模型的结构或权重可能不稳定，可能导致 Segmentation Fault。确保你的模型结构正确，权重初始化合理。
驱动问题：GPU 驱动程序可能会出现问题，导致 Segmentation Fault。请确保你的 GPU 驱动程序是最新的，并且与 PyTorch 版本兼容。

解决手段：

print(torch.__version__)   # 2.0.1  
print(torch.cuda.is_available())    # False

因为返回时False,所以版本匹配有问题。

查看 cuda 版本：nvcc -V
Cuda compilation tools, release 11.7, V11.7.64
Build cuda_11.7.r11.7/compiler.31294372_0

**重新安装： **
print(torch.version) # 2.0.1 +cu117
print(torch.cuda.is_available()) #True

原因找到，是cuda的版本不对应的问题。在下面网址找到对应的版本。
https://pytorch.org/get-started/previous-versions/

关注