【解决】nvidia nx板运行python程序出现Segmentation fault (core dumped)问题

原创

已于 2024-10-17 11:37:42 修改 · 606 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#python #深度学习 #pytorch

于 2024-10-16 15:50:40 首次发布

问题：拷贝系统后，运行python程序出现Segmentation fault (core dumped)问题。

bdlf@bdlf-desktop:~/2、car_detect$ python3 test_zxh.py
Segmentation fault (core dumped)

解决思路：

在主程序最开始加入两行代码：

import faulthandler
faulthandler.enable()
# 下面是原代码

运行程序，出现以下问题：

OSError: libcublasLt.so.10: cannot open shared object file: No such file or directory

查看CUDA Toolkit是否已经安装在系统上，若已安装，确保libcublasLt.so.10文件存在于系统上，可以使用如下命令查找该文件：

bdlf@bdlf-desktop:~/1、logistics_service$ find /usr/local -name libcublasLt.so.10
/usr/local/cuda-10.2/targets/aarch64-linux/lib/libcublasLt.so.10

重新安装nvidia-jetpack后，再次尝试运行程序，又出现新的问题，可能与torch有关。

bdlf@bdlf-desktop:~/1、logistics_service$ python3 test_zxh.py
Fatal Python error: Illegal instruction

Current thread 0x0000007f8a878010 (most recent call first):
File "<frozen i

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

WXG1011

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

PyTorch DataLoader 报错 Segmentation fault (core dumped) 的原因及解决方案

沉迷单车的追风少年

04-28

2595

其他出core的方法都可以通过这个方法来排查，查看出core的具体原因。这里是因为torch的版本和CUDA的版本不匹配导致的错误。Pytorch DataLoader 读取数据。

（5）Segmentation fault (core dumped)

qq_40259429的博客

07-02

1325

（1）猜测显卡内存满了：观察：查看占用显存的任务，在终端输入：watch -n 1 nvidia-smi 来源：Segmentation fault (core dumped)（核心转载）与清理显存等问题解决（2）Tranformer在读取预训练模型时出现Segmentation fault (core dumped) 解决方法：将torch升级到1.5.0 pip install torch==1.5.0 来源：【已解决】Tranformer读取模型时Segmentation fault (core

参与评论您还未登录，请先登录后发表或查看评论

Segmentation fault (core dumped)---NVIDIA的jetson-inference项目中报段错误的解决

xuemei0501的博客

12-30

1179

NVIDIA官网的jetson-inference项目中报段错误的解决：依据官方提供步骤执行搭建jetson-inference环境完成后，执行python脚本时一直会报段错误，如： >>> import jetson.inference Segmentation fault (core dumped) 于是重新编译重新操作验证等试了很多种方法均不行，最后还是从根本原因入手解决，先判断导入的一些库时存在的，所以问题就是找不到库，于是通过往export里写一个全局变量LD_LIBRARY

NVIDIA Jetson TK1终端运行rviz显示segmentation fault的解决方法

了不起的菠萝君的博客

09-18

718

问题描述终端运行 rosrun rviz rviz 显示 $ Segmentation fault 解决办法方案一一、重新设定TK1的显卡设置 sudo apt-get purge nvidia-* sudo rm /etc/X11/xorg.conf 　# if the file does not exist , then is OK sudo...

core dump gdb调试

weixin_34186950的博客

06-28

1443

core dump又叫核心转储, 当程序运行过程中发生异常, 程序异常退出时, 由操作系统把程序当前的内存状况存储在一个core文件中, 叫core dump. (linux中如果内存越界会收到SIGSEGV信号，然后就会core dump) 在程序运行的过程中，有的时候我们会遇到Segment fault(段错误)这样的错误。这种看起来比较困难，因为没有任何的栈、trace信息输出。该种类型的...

【Q&A】Python代码调试之解决Segmentation fault (core dumped)问题

小哲的博客

04-20

3万+

在使用半导体作为内存的材料前，人类是利用线圈当作内存的材料（发明者为王安），线圈就叫作 core ，用线圈做的内存就叫作 core memory。如今，半导体工业澎勃发展，已经没有人用 core memory 了，不过，在许多情况下，人们还是把记忆体叫作 core。

wsl2输入nvidia-smi后显示一部分信息后报segmentation fault的错误（已解决）

m0_56507446的博客

03-27

2688

如何解决这个问题呀？希望知道的大神能给出解决方法。

服务器上运行代码提示Segmentation fault (core dumped)

02-22

### 关于服务器上运行代码时出现 `Segmentation fault (core dumped)` 错误的原因及解决方案 #### 一、常见原因分析 `Segmentation fault (core dumped)` 是指程序试图访问未分配给它的内存区域所引发的一种严重...

nc 45.40.247.139 30933 Welcome to YCB2025! Good luck! aaaabaaacaaadaaaeaaafaaagaaahaaaiaaajaaakaaalaaamaaanaaaoaaapaaaqaaaraaasaaataaauaaavaaawaaaxaaayaaa bye~ ./Stack_Over_Flow Welcome to YCB2025! Good luck! aaaabaaacaaadaaaeaaafaaagaaahaaaiaaajaaakaaalaaamaaanaaaoaaapaaaqaaaraaasaaataaauaaavaaawaaaxaaayaaa zsh: segmentation fault ./Stack_Over_Flow 这是两种情况，为什么会这样，该怎么解决

最新发布

10-13

Segmentation fault (core dumped) # 3. 分析 core 文件 gdb ./Stack_Over_Flow core -ex "bt" -ex "x/i $rip" # 典型输出： # ▶ 0x41414141 in ?? () # RIP 被覆盖为 'AAAA' # ``` ### 解决方案 #### 对于 nc ...

python下mxnet 编译安装遇到问题汇总（一）

jinhao_2008的专栏

01-21

2903

首先说一下为什么编译安装通过pip install mxnet 安装遇到Illegal instruction (core dumped) 已经过一番查找，原来是因为服务器cpu 指令集sse 不支持，mxnet pip安装支持编码集是avx，查看命令：cat /proc/cpuinfo flags : fpu de pse tsc msr pae mce cx8 ...

【记录】ORB-SLAM3编译以及在realsense D435i运行

qq_33310245的博客

03-07

1万+

D435i的配置安装realsense sdk 和ros wrapper，安装完成后，输入： realsense-viewer ROS接口的使用启动RealSense的ROS节点 realsense的ROS接口可以理解为一个读取数据并发布topic的节点，自己写ROS程序的时候订阅这个节点发出的topic即可 roslaunch realsense2_camera rs_camera.launch 使用rostopic list查看这些节点也可以使用rqt_image_view订阅这

onnx模型转TensorRT 报错 - Segmentation fault (core dumped) | Your ONNX model has been generated...【最新总结】

专注于AI领域前沿技术学习与分享：目标检测、图像修复、超分重建、AI工程化

09-26

8459

这个报错，目前这个博客提供的方法，然而并没有解决我的问题【这里做个备忘】 https://blog.csdn.net/weixin_41010198/article/details/107712487 文章目录【运行报错一】Segmentation fault (core dumped)onnxsim 进行精简转换成功【PASSED 得到 yolov4_-1_3_608_608_dynamic.engine】【报错二】 ERROR: coreReadArchive.cpp (41) - Serializ.

Segmentation fault (core dumped)

C or CPP

07-06

3251

出现 “Segmentation fault (core dumped)” 错误通常意味着程序访问了未分配的内存或者越界访问了已分配内存之外的区域。空指针解引用：尝试对空指针进行操作。内存越界：访问了超出分配内存边界的区域。栈溢出：递归深度过大或者局部变量过多导致栈空间不足。使用调试器如gdb来跟踪程序运行时的状态，从而定位具体的错误发生位置。检查代码中的指针操作，确保不会解引用空指针或者越界访问。考虑使用内存检测工具（如 Valgrind）来帮助检测内存泄漏或者非法内存访问问题。

NVIDIA Jetson TK1 rosrun rviz segmentation fault的解决方法

weixin_34341117的博客

03-27

208

NVIDIA Jetson TK1 rosrun rviz segmentation fault的解决方法在NVIDIA Jetson TK1开发版上运行rosrun rviz rviz出现segmentation falut错误。常见的解决方法，见Alyson的博客:NvidiaTegra TK1 安裝 ROS on Ubuntu arm 發生 Segmentatio...

关于Segmentation fault (core dumped)几个简单问题

热门推荐

yam_killer的专栏

09-12

6万+

有的程序可以通过编译，但在运行时会出现Segment fault(段错误)。这通常都是指针错误引起的。但这不像编译错误一样会提示到文件一行，而是没有任何信息。一种办法是用gdb的step, 一步一步寻找。但要step一个上万行的代码让人难以想象。我们还有更好的办法，这就是core file。如果想让系统在信号中断造成的错误时产生core文件, 我们需要在shell中按如下设置: #设置c

python遇到 Segmentation fault (core dumped) 错误

weixin_43679461的博客

06-17

2624

深度学习遇到问题

Segmentation fault (core dumped)排查

j_starry的博客

05-09

2128

同事的经验，把opencv-contrib-python卸载，opencv-python-headless重装，可以尝试把opencv-python相关的都卸载重装，但是对我来说不管用。先泼盆冷水，这个问题比较棘手，有的能通过重装opencv相关包修复，有的可能还是直接换一个没问题的环境比较快……我最后是没有解决的，折腾了几个小时后，还是听同事的话，把docker镜像重启了，幸好能恢复到原来的环境。然后继续按这个帖子尝试gbd排查，如果没有这个包就先apt-get安装下：。这里记录下我的尝试吧。

Segmentation fault (core dumped)分析排查

GHL284271090的博客

10-10

1870

cat /proc/sys/kernel/core_pattern输出|/usr/share/apport/apport %p %s %c %d %P %E，查了之后发现ubuntu预装了apport错误收集系统，sudo service apport stop之后就可以了，这时发现core文件可以生成了。当然也可以定制core输出目录，比如：echo "/data/procdump/core-%e-%p-%s" > /proc/sys/kernel/core_pattern。

python程序报错Segmentation fault (core dumped)

03-22

### Python 程序中 Segmentation Fault (core dumped) 的原因分析 `Segmentation fault (core dumped)` 是一种常见的运行时错误，通常表示程序尝试访问未分配给它的内存区域。这种问题可能由多种因素引起，尤其是在复杂的环境中（如深度学习框架）。以下是可能导致该问题的原因以及相应的解决方法： #### 1. **C/C++ 扩展模块中的 Bug** 如果 Python 使用了 C 或 C++ 编写的扩展模块，则这些模块可能存在内存管理方面的缺陷。例如，在 PyTorch 中使用的 `DataLoader` 如果配置不当时可能会触发此问题[^3]。 - 解决方案：通过调试工具定位核心转储文件的具体位置并修复底层实现逻辑。 - 安装 `pystack` 工具来解析 core 文件： ```bash pip install pystack pystack core <core_file_path> ``` #### 2. **第三方库版本冲突** 当多个不同版本的库共存于同一环境时，尤其是像 TensorFlow 和 PyTorch 这样的大型机器学习框架及其依赖项之间可能发生冲突。比如预先安装好的 libtorch 库与当前项目需求不符也会引发此类异常[^4]。 - 处理办法：移除不必要的旧版或冗余库，并重新构建干净的工作空间。 - 删除已有的 libtorch 库后再测试新脚本是否会正常工作；若未来仍需利用到 libtorch 功能则考虑隔离开发路径或者采用虚拟化技术分别维护两套独立设置。 #### 3. **硬件资源不足** 对于某些高性能计算任务而言，若物理 RAM 不足以支持整个过程所需的数据量大小加上临时变量开销的话也可能造成崩溃现象发生。 - 调整策略包括减少批量尺寸(batch size)，优化数据加载方式等措施减轻负载压力；另外还可以启用交换分区作为补充手段缓解短期短缺状况。 ```python import torch.utils.data as data_utils batch_size = 8 # 尝试降低批次数量看看效果如何改善 train_loader = data_utils.DataLoader(dataset=train_set, batch_size=batch_size, shuffle=True) ``` #### 4. **操作系统层面的因素** 有时即使应用程序本身没有明显漏洞也有可能因为 Linux 内核参数设定不合理而受到影响。例如过低的最大堆栈大小限制(`ulimit`)就容易导致上述报错消息出现。 - 修改 shell session 上限值命令如下所示： ```bash ulimit -s unlimited ``` --- ### 总结建议针对以上几种常见情形逐一排查直至找到确切根源为止。同时注意保留完整的日志记录以便后续深入研究必要时候联系官方技术支持团队获取进一步帮助。