ubuntu16+NVIDIA驱动+CUDA+cuDNN配置安装



pip安装超时

python pip下载速度慢的解决方法

sudo touch ~/.pip/pip.conf #创建pip配置文件
sudo gedit ~/.pip/pip.conf #编辑该文件
# 添加如下内容
[global]
index-url = https://pypi.tuna.tsinghua.edu.cn/simple #添加清华镜像

保存退出即可

安装使用链接下载工具axel

ubuntu使用命令行下载文件,使用命令行直接通过连接下载文件

sudo apt-get install axel

Teamview连接

Ubuntu下用命令行安装TeamViewer

下载安装

#下载teamviewer
axel https://download.teamviewer.com/download/linux/teamviewer_amd64.deb
#执行命令,忽略报错
sudo dpkg -i teamviewer_amd64.deb
##报错原因:这是由于我的ubuntu系统是64位的,必须添加32位的架构。
#添加32位架构
sudo dpkg --add-architecture i386
sudo apt-get update
## 在缺少依赖包的安装 需要执行:sudo apt-get -f install
sudo apt-get -f install

#重新执行安装命令
sudo dpkg -i teamviewer_amd64.deb

#接受license
## 停止服务。执行命令 
sudo teamviewer --daemon stop

#修改配置文件
cd /opt/teamviewer/config/
ll
sudo vim global.conf
##添加以下内容
[int32] EulaAccepted = 1 
[int32] EulaAcceptedRevision = 6
#wq保存退出
cat global.conf #确认修改成功

启动teamviewer

sudo teamviewer --daemon start #启动
sudo teamviewer --passwd 123456 #设置密码
sudo teamviewer --info print id #获取teamviewer ID

重启后再进行连接即可。

ssh连接服务器被拒绝

连接Ubuntu提示SSH连接被拒绝修复方法

image-20200622184711214

sudo ufw disable #关闭防火墙
#Ubuntu系统上安装、启动sshd服务
sudo apt-get install openssh-server
sudo /etc/init.d/ssh restart 

硬盘挂载

ubuntu 磁盘管理工具 ---- GParted 图形化分区工具

直接在ubuntu应用商店安装磁盘管理工具GParted,打开找到要挂载的硬盘:

image-20200622195525052

先用该工具进行分区。

ubuntu 16.04 硬盘分区,挂载,硬盘分区方案参考该链接进行硬盘挂载。

这个也可以参考下:Ubuntu挂载硬盘方法

安装NVIDIA驱动

安装成功:

  • 2020.6.20

学弟说也可以直接装CUDA,会连带驱动进行安装。,没成功,感觉不靠谱。

可以直接通过软件更新来安装

image-20200620150809168

如果不成功可以采样如下方法来解决。

卸载原有的NVIDIA驱动(没装的话就跳过)

一般方法

sudo apt-get remove –purge nvidia*
sudo apt-get autoremove

如果使用.run文件安装,使用–uninstall卸载(具体方法百度)

禁用nouveau

安装NVIDIA需要把系统自带的驱动禁用,打开文件:

sudo gedit /etc/modprobe.d/blacklist.conf

在文本最后添加以下内容:

blacklist nouveau
option nouveau modeset=0

命令窗口会提示warn,无视之。

保存退出,执行以下命令生效:

sudo update-initramfs -u

重启电脑后输入:

lsmod | grep nouveau

没有任何输出说明禁用成功。

可以通过xshell进行操作,很方便。

将下载好的NVIDIA-Linux-x86_64-430.40.run复制到/home目录下,更改权限

sudo chmod a+x NVIDIA-Linux-x86_64-430.40.run

GPU信息

ren@r-Super-Server:~$ lspci |grep VGA
03:00.0 VGA compatible controller: NVIDIA Corporation GP104 [GeForce GTX 1070] (rev a1)

驱动选择

https://www.nvidia.com/Download/Find.aspx?lang=en-us

1566440619995

禁用X服务

sudo service lightdm stop

安装

linux怎么切换tty终端命令行(文本模式)

sudo chvt 2 #进入tty2
sudo chvt 7 #退出

Ctrl+Alt+F1进入命令行,输入用户名密码登录(通过Ctrl+Alt+F7可返回界面,此时的数字键盘可能无法使用,可以使用右侧键盘上的数字输入密码)

sudo ./NVIDIA-Linux-x86_64-430.40.run -no-x-check -no-nouveau-check -no-opengl-files
  • –no-opengl-files 只安装驱动文件,不安装OpenGL文件。这个参数最重要
  • –no-x-check 安装驱动时不检查X服务
  • –no-nouveau-check 安装驱动时不检查nouveau

后面两个参数可不加。如果该过程出错,注意查看原因,gcc、g++版本不对也不行

gcc,g++卸载与重装

gcc -v #查看版本
g++ -v
sudo apt-get remove gcc #卸载gcc
sudo apt-get install gcc #重新安装gcc

安装完毕后重启验证是否安装成功:

nvidia-smi

1566529888883

出现以上类似的输出表示已经安装成功

启动显示服务

sudo service lightdm restart

版权声明:本文为CSDN博主「墨成鱼」的原创文章,遵循CC 4.0 by-sa版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/zhang970187013/article/details/81012845

CUDA10+cuDNN+pytorch110

Ubuntu卸载Cuda

没有安装可以自行跳过,切记CUDA版本不要太高,先看下你要配置的深度学习环境支持的CUDA版本。一定要在注意cuda版本和pytorch适配。cuDNN还是没有严格要求对应。

安装CUDA

可参考:ubuntu18.04安装Anaconda+tensorflow-gpu+keras

~~因为之后需要安装cuda,cudnn等,gcc,g++版本太高会无法配置,建议降级到5.0或者4.8.~~这个太坑了,导致我nvidia的驱动一直安装失败。

安装CUDA

到CUDA官网下载对应的CUDA版本:CUDA Toolkit Archive

找到你要使用的版本。点击进入你要进行安装的版本,进入系统配置选择界面,选择对应的配置,最后一个Installer Type选择第一个,需要的命令最少:

image-20200621074359520

按照对应的安装介绍进行安装:

image-20200621074430760

注意按照自己的系统配置选择合适的版本

axel https://developer.nvidia.com/compute/cuda/10.0/Prod/local_installers/cuda_10.0.130_410.48_linux #下载cuda——10.0.130
axel http://developer.download.nvidia.com/compute/cuda/10.0/Prod/patches/1/cuda_10.0.130.1_linux.run #下载补丁
sudo sh cuda_10.0.130_410.48_linux.run #安装

第一个叉掉,不要重复安装驱动:

image-20200620213821470

配置环境变量

sudo gedit ~/.barshrc   #打开barshrc文件,添加路径,并将后面两句加在代码末尾
export PATH=/usr/local/cuda-10.0/bin${PATH:+:$PATH}}             
export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
source ~/.bashrc          #使上述操作生效

如果测试conda,显示conda找不到指令,也是添加环境变量,把路径换成自己的

sudo gedit ~/.barshrc ##打开barshrc文件,添加路径,并将后面一句加在代码末尾
export PATH="/home/hqy/anaconda3/bin:$PATH #
source ~/.bashrc
conda #测试

测试是否安装成功

nvcc -V #查看nvcc版本
cat /usr/local/cuda-10.0/version.txt #查看cuda 版本,加速并行计算

image-20200621081025827

可能问题

  • nvcc指令版本不对

解决sudo下nvcc找不到问题

which nvcc #先寻找nvcc位置
sudo ln -s /path /sbin/nvcc.  #得到路径后,建立软链接。path是上一步得到的位置
sudo reboot #重启
nvcc -V #重新查询

安装CUdnn

到官网cuDNN Archive下载cuDNN,加速神经网络的计算。cuDNN版本和CUDA版本不必要 完全一致。

image-20200620232507552

下载下划线版本。注意修改下面的cudnn版本,和你要安装的保持一致。前面的所有都是。

axel https://developer.nvidia.com/compute/machine-learning/cudnn/secure/7.6.4.38/Production/10.0_20190923/cudnn-10.0-linux-x64-v7.6.4.38.tgz #下载
tar -zxvf cudnn-10.0-linux-x64-v7.6.4.38.tgz #解压
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/ -d
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

测试是否安装成功

cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2 #查看cudnn 版本,用来加速神经网络的计算

image-20200620232826588

总体测试

nvidia-smi #查看nvidia驱动是否正常
nvcc -V #查看nvcc版本
cat /usr/local/cuda/version.txt #查看cuda 版本,加速并行计算
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2 #查看cudnn 版本,用来加速神经网络的计算
1566529888883image-20200621082030836

安装Anaconda

官方网站或者 清华镜像下载,按照网站上的提示选择自己系统适合的版本。

下载地址:Anaconda3-4.2.0-Linux-x86_64.sh

安装、测试:

axel https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-4.2.0-Linux-x86_64.sh #下载
bash Anaconda3-4.2.0-Linux-x86_64.sh
source ~/.bashrc #使环境变量立即生效
conda #测试,正常输出即表示安装成功

image-20200621070652476

配置pytorch==1.1.0+CUDA==10.0

安装虚拟环境

conda create -n pytorch python=3.5 pandas numpy matplotlib
source activate pytorch #激活虚拟环境

安装pytorch==1.1.0

axel https://download.pytorch.org/whl/cu100/torch-1.1.0-cp35-cp35m-linux_x86_64.whl
pip install torch-1.1.0-cp35-cp35m-linux_x86_64.whl
axel https://download.pytorch.org/whl/cu100/torchvision-0.3.0-cp35-cp35m-linux_x86_64.whl
pip install torchvision-0.3.0-cp35-cp35m-linux_x86_64.whl

不得不说官方指令是真的扯,很多时候各种不行。

测试

zhangsan@zhangsan-X299-WU8:~$ source activate pytorch
(pytorch) zhangsan@zhangsan-X299-WU8:~$ python
Python 3.5.4 |Continuum Analytics, Inc.| (default, Aug 14 2017, 13:26:58) 
[GCC 4.4.7 20120313 (Red Hat 4.4.7-1)] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import torch
>>> import torchvision
>>> torch.cuda.is_available() #测试cuda,使用GPU
True

image-20200621082634135

相关指令

conda info -e #显示环境列表
watch -n 1 nvidia-smi #实时查看GPU使用情况,1表示查看时间的间隔

卡在开机界面,用户的登陆界面死循环

成功:

  • 2020.6.20

原因:NVIDIA 驱动所致,之前安装方式nvidia驱动出问题。

解决办法:卸载nvidia驱动,重新安装。

(1)进入文本模式:CTRL+ALT+F1 ,命令行

sudo chvt 2

(2)Uninstall any previous drivers:

sudo apt-get remove nvidia-*
sudo apt-get autoremove

(3)Uninstall the drivers from the .run file:

sudo nvidia-uninstall
sudo chvt 7 #退出tty模式

(4)此时,重启可login normally.
(5)驱动重新安装:(这种安装方式很好,测试方便快捷)

(1)Ctrl+Alt+F1进入tty模式,登陆,注意密码输入不要使用右侧小键盘。
(2)sudo service lightdm stop
(3)sudo ./NVIDIA-Linux-x86_64-430.40.run -no-x-check -no-nouveau-check -no-opengl-files

-no-x-check安装驱动时关闭x服务;
-no-nouveau-check 安装驱动时禁用Nouveau
-no-opengl-files 安装时只装驱动文件,不安装Opengl

(6)sudo service lightdm restart(可正常登录)
(7)重启不会出现循环登录。

Ubuntu 16.04 一直卡在开机界面或者用户登录界面死循环问题的解决

可能报错如下:

参考:ERROR: You appear to be running an X server; please exit X before installing.

ERROR: You appear to be running an X server; please exit X before installing.

wKioL1Z5L1WiPM96AAB6l5ihtUo064.png

解决办法:

进入tty模式

Ctrl+Alt+F1进入tty命令行,输入用户名密码登录(通过Ctrl+Alt+F7可返回界面,此时的数字键盘可能无法使用,可以使用右侧键盘上的数字输入密码)

Localhostlogin: r
Password:

切换到根权限

首先在正常模式下设置root用户

设密码,

sudo passwd root

1566531910917

ubuntu如何进入根用户

在tty模式下,进入超级用户模式下:
[admin@localhost  ~]$ su - root
[root@localhost  ~]#

出现3个菱形,输入超级用户的密码即可。注意:不要使用右侧小键盘上的数字

1566535187773

输入init3进入文本模式

[root@localhost  ~]# init 3

返回图形界面init 5

找到NVIDIA-Linux-x86_64-430.40.run所在的文件夹

[root@localhost  ~]# cd /home/admin
[root@localhost  r]# ll
-rwxrwxrwx1 root root 69824601 Nov 10 01:48 NVIDIA-Linux-x86_64-430.40.run

运行安装文件

[root@localhost  r]# sh NVIDIA-Linux-x86_64-430.40.run

安装过程中根据相应提示,即可完成安装

过程

安装完成之后发现在登陆界面进入死循环,索性删除了Nvidia的驱动

sudo apt-get remove –purge nvidia*
sudo apt-get autoremove

Ctrl+Alt+F7返回桌面,仍然是无法进入

重启后可进入,驱动居然安装成功,莫名奇妙。。。。。^_^

相关知识

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
Ubuntu安装显卡驱动CuDNNCUDA和PyTorch可以按照以下步骤进行: 1. 安装显卡驱动:可以通过以下几种方式安装显卡驱动: - 通过"Software & Updates"工具在“Additional Drivers”选项卡中选择一个适用于您的显卡型号的驱动程序,并点击“Apply Changes”进行安装。 - 通过命令行使用`ubuntu-drivers devices`命令查看可用的驱动,然后使用`sudo ubuntu-drivers autoinstall`命令自动安装推荐的驱动。 2. 安装CuDNNCuDNNNVIDIA加速库,可提供用于深度学习的GPU加速功能。可以按照以下步骤安装CuDNN: - 前往NVIDIA官方网站,下载适用于您的CUDA版本的CuDNN压缩文件(通常需要注册NVIDIA开发者账号)。 - 将CuDNN压缩文件解压缩到一个合适的位置,例如`~/cuda`文件夹。 - 打开终端,使用`cd`命令进入CuDNN解压缩文件的路径,并执行以下命令安装CuDNN: ``` sudo cp cuda/include/cudnn*.h /usr/local/cuda/include/ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/ sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn* ``` 3. 安装CUDACUDA是用于在NVIDIA GPU上进行并行计算的平行计算平台和API。可以按照以下步骤安装CUDA: - 前往NVIDIA官方网站,选择适用于您的显卡和操作系统的CUDA版本,并下载对应的运行文件(通常需要注册NVIDIA开发者账号)。 - 打开终端,使用`cd`命令进入CUDA运行文件所在的目录,并执行以下命令安装CUDA: ``` sudo sh cuda*.run ``` - 执行安装向导中的步骤,根据提示进行安装配置,包括选择安装路径和设置环境变量。 - 安装完成后,可以通过执行`nvcc --version`命令验证CUDA安装情况。 4. 安装PyTorch:PyTorch是一个用于构建深度学习模型的开源Python库。可以按照以下方式安装PyTorch: - 打开终端,执行以下命令安装PyTorch: ``` pip install torch torchvision ``` - 在安装过程中,可能需要下载和编译一些依赖项。请耐心等待安装完成。 安装完成后,您可以在Ubuntu上使用显卡驱动CuDNNCUDA和PyTorch进行深度学习任务。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

鹏RPZ

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值