ubuntu18.04运行深度学习模型时,死机

问题描述

键盘 鼠标失效,图形界面卡顿,程序不再运行

2021.11.13

仅使用CPU运行程序,程序挂在后台运行,桌面开启时不卡顿,关闭桌面之后,ubuntu卡死,键盘鼠标都无法使用。

使用GPU运行程序时,即便一直开启桌面,也会卡死。

 使用GPU运行程序时,使用pycharm or 浏览文件 速度过快,也会导致ubuntu卡死。

ubuntu系统卡死指的是 键盘鼠标都无法使用,显示器的时间也不动,后台运行的代码也断了(因为没有新的文件生成)。

CTRL+ALT+ SYSRQ无效

tty无效

解决Ubuntu卡死 - 斯潘的博客 | BY Blog

左手按住 CTRL 和 ALT键不松手(一直到结束都不松手)
右手按一下 SYSRQ,等待一秒以上
右手按一下 R 键,再次等待一秒
右手按一下 E 键,再次等待一秒
右手按一下 I 键,等待大概五秒
右手按一下 S 键,等待大概五秒
右手按一下 U 键,等待大概五秒
右手按一下 B 键

可能原因

深度学习项目训练时突然卡住或崩盘问题_Z.B_dream的博客-CSDN博客_训练时卡住

1.显卡版本

ubuntu16.04跑深度学习模型时,图形界面卡顿_yscoder的博客-CSDN博客

ubuntu18.04跑深度学习模型时,图形界面卡顿,其原因是显卡版本和cuda要求的显卡版本不一致

2.cuDNN

cuDNN 有问题 可能是GPU问题的原因之一??

之前提示 软连接的问题   refer your photo.

3.Ubuntu系统

4.CPU温度过高

需要查看log,以确认。

可参考:

服务器正常运行温度范围 & ubuntu查看cpu温度 & cpu温度过高_如果曾经拥有的博客-CSDN博客_服务器查看cpu温度

5. 无线网卡问题

ubuntu20.04不定时卡死,鼠标和键盘都不可用,且tty无效(rtw_88系列网卡驱动问题)_Torch_HXM的博客-CSDN博客_ubuntu卡死鼠标不能动

如何排查

电脑突然经常死机?(ubuntu系统如何检查原因)_shuozhang_Hebut的博客-CSDN博客_ubuntu死机查看日志

vim /car/log/syslog

找出死机时候的对应log。

reference

ubuntu16.04跑深度学习模型时,图形界面卡顿

Ubuntu16.06 单Nvidia显卡 深度学习运行时 界面卡顿(刷新慢)的解决方法

ubuntu系统突然卡机或者完全死机怎么办

Ubuntu下图形界面卡死解决办法

https://www.v2ex.com/t/565273

已经装好了18.04,但经常死机 - 页 2 - Ubuntu中文论坛

  • 0
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Ubuntu 18.04配置深度学习环境的步骤如下: 1. 安装CUDA和cuDNN 首先需要安装CUDA和cuDNN,这是深度学习框架的基础。可以从NVIDIA官网下载对应版本的CUDA和cuDNN,然后按照官方文档进行安装。 2. 安装Python和pip Ubuntu 18.04自带Python 3,但是需要安装pip,可以使用以下命令进行安装: ``` sudo apt-get update sudo apt-get install python3-pip ``` 3. 安装深度学习框架 常用的深度学习框架有TensorFlow、PyTorch、Keras等,可以使用pip进行安装。例如安装TensorFlow: ``` pip3 install tensorflow-gpu ``` 4. 安装其他依赖库 深度学习还需要其他一些依赖库,例如numpy、scipy、matplotlib等,可以使用pip进行安装。 ``` pip3 install numpy scipy matplotlib ``` 5. 配置环境变量 需要将CUDA和cuDNN的路径添加到环境变量中,可以在.bashrc文件中添加以下内容: ``` export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH export PATH=/usr/local/cuda/bin:$PATH ``` 6. 测试环境 可以使用以下命令测试环境是否配置成功: ``` python3 import tensorflow as tf tf.Session() ``` 如果没有报错,说明环境配置成功。 以上就是Ubuntu 18.04配置深度学习环境的步骤。 ### 回答2: Ubuntu 18.04是一款流行的操作系统,对于想要学习和开发深度学习等机器学习应用的人来说是一个很好的选择。在本文中,我们将介绍如何配置Ubuntu 18.04的深度学习环境。 首先,我们需要安装一些必要的工具和依赖项,包括python3、pip、numpy、matplotlib和jupyter等。我们可以使用以下命令进行安装: ```bash sudo apt update sudo apt install python3-pip python3-dev sudo pip3 install numpy matplotlib jupyter ``` 在安装了这些工具之后,就需要安装深度学习框架了。TensorFlow是一款非常流行的深度学习框架,可以使用以下命令安装: ```bash sudo pip3 install tensorflow ``` 如果你想使用Keras这个更高层次的深度学习框架,可以这样安装: ```bash sudo pip3 install keras ``` 除了TensorFlow和Keras之外,还有一些其他的深度学习框架可以被安装在Ubuntu 18.04上,比如PyTorch和Caffe等。 接着,我们还需要安装GPU驱动和CUDA等组件,以便在GPU上运行深度学习应用。首先我们需要检查系统中已经安装的显卡型号,可以使用以下命令: ```bash lspci | grep -i nvidia ``` 然后查找显卡型号对应的驱动版本号,可以到NVIDIA官网查找。例如,如果你的显卡是GTX 1080,那么就需要安装nvidia-430或更高版本的驱动。 ```bash sudo apt install nvidia-driver-430 ``` 接下来就需要安装CUDA。在安装CUDA之前,我们需要先安装其中的一个依赖项,nvidia-modprobe: ```bash sudo apt install nvidia-modprobe ``` 安装完成后,我们可以到NVIDIA官网下载CUDA安装包,根据操作系统和显卡类型选择相应的版本进行下载,然后执行以下命令进行安装: ```bash sudo dpkg -i cuda-repo-ubuntu1804-<version>.deb sudo apt-key adv --fetch-keys http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub sudo apt-get update sudo apt-get install cuda ``` 安装完成后,还需要设置环境变量,将CUDA安装路径加入到系统环境变量中。可以编辑/etc/environment文件,在其中加入以下内容: ```bash export PATH=/usr/local/cuda/bin:$PATH export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH ``` 最后,我们需要安装cuDNN。cuDNN是一个针对GPU加速的深度学习库,可以在NVIDIA官网下载对应版本的cuDNN,然后执行以下命令: ```bash tar xvfz cudnn-<version>-linux-x64-v7.6.5.32.tgz sudo cp -P cuda/include/cudnn.h /usr/local/cuda/include sudo cp -P cuda/lib64/libcudnn* /usr/local/cuda/lib64 sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn* ``` 至此,我们已经成功地安装了Ubuntu 18.04的深度学习环境,可以开始进行深度学习的学习和开发了。 ### 回答3: Ubuntu 18.04 是目前最常用的 Linux 操作系统之一,深度学习也越来越受到广泛关注。在此我们介绍如何在 Ubuntu 18.04 上配置深度学习环境,主要需要配置的有 Python 3,CUDA 及 CUDNN。 第一步:更新系统 首先,在执行任何操作之前,我们需要更新 Ubuntu 系统。在终端中,输入以下命令即可: sudo apt-get update sudo apt-get upgrade 第二步:安装 Python3 Ubuntu 18.04 默认已经安装了 Python 3,如果没有安装,可以在终端中输入以下命令: sudo apt-get install python3 以及 pip3: sudo apt-get install python3-pip 这样 Python3 就安装完成了。 第三步:安装 CUDA 由于深度学习的计算复杂度很高,因此我们需要使用 GPU 来加速运算。CUDA 是一种计算机图形学技术,可以利用 NVIDIA 的显卡进行并行计算。安装 CUDA 首先需要检查你的显卡是否支持 CUDA,以确保安装可行。如果你不确定你的显卡是否支持 CUDA,可以通过以下方式查询: nvidia-smi 如果显示信息中包含了 CUDA 字样,那么你的显卡支持 CUDA。整个 CUDA 安装过程比较繁琐,因此我们建议直接到 NVIDIA 官网下载安装包。在下载,建议选择用 deb(local) 安装。 下载完毕后,直接在终端中执行以下命令安装即可: sudo dpkg -i cuda-repo-ubuntu1604-10-1-local-10.1.105-418.39_1.0-1_amd64.deb sudo apt-key add /var/cuda-repo-<version>/7fa2af80.pub sudo apt-get update sudo apt-get install cuda 安装完毕后,我们需要添加相关环境变量,以便电脑能够正常识别 CUDA。在终端中执行以下命令: nano .bashrc 在文件末尾添加以下代码,并保存退出: export PATH=/usr/local/cuda-10.1/bin${PATH:+:${PATH}} export LD_LIBRARY_PATH=/usr/local/cuda-10.1/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}} 第四步:安装 CUDNN CUDNN 是 NVIDIA 提供的深度学习库,用于加速深度学习的运算。我们需要先到 CUDNN 官网下载相应的安装包。在下载,建议选择用 deb(local) 安装。 下载后,我们在终端中执行以下命令安装: sudo dpkg -i libcudnn7_7.x.x.x-1+cuda10.0_amd64.deb sudo dpkg -i libcudnn7-dev_7.x.x.x-1+cuda10.0_amd64.deb sudo dpkg -i libcudnn7-doc_7.x.x.x-1+cuda10.0_amd64.deb 最后,我们在终端中输入以下命令,检查 CUDNN 是否安装成功: nvcc -V 至此,Ubuntu 18.04 的深度学习环境配置已经完成。希望这篇指南能够帮助到需要配置深度学习环境的同学。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值