Ubuntu18.4+cuda10.0+cudnn+tensorflow+pytorch
一.Ubuntu18.4安装:
分区划分:
- efi:200M
- swap:内存的1-2倍
- /:格式为ext4 20-30g
- /home:格式为ext4
卡死解决办法:ubuntu双系统启动时卡死解决办法
无法开启WiFi:ubuntu驱动正常不显示wifi列表(wifi disable)解决办法
二.CUDA安装
参考:cuda安装
- 驱动安装:
进入系统后,系统默认是使用主板上的集成显卡,那么,我们需要做的事就是安装上自己 的独立显卡,也就是titan xp的驱动。此处给大家示范其中一个方法(自己的显卡对应自己的信息,以下只是示例):
具备条件:root权限进行操作
修改root密码:
$ sudo passwd 输入两次新密码
$ su root 登陆 root账户
1.显卡驱动安装:
step .1:首先,检测你的NVIDIA图形卡和推荐的驱动程序的模型。执行命令:
$ ubuntu-drivers devices
输出结果为:
== /sys/devices/pci0000:00/0000:00:01.0/0000:01:00.0 ==
modalias : pci:v000010DEd00001180sv00001458sd0000353Cbc03sc00i00
vendor : NVIDIA Corporation
model : GK104 [GeForce GTX 680]
driver : nvidia-304 - distro non-free
driver : nvidia-340 - distro non-free
driver : nvidia-384 - distro non-free recommended
driver : xserver-xorg-video-nouveau - distro free builtin
== cpu-microcode.py ==
driver : intel-microcode - distro free
从中可以看到,这里有一个设备是GTX 680 ,对应的驱动是NVIDIA -304,340,384 ,而推荐是安装384版本的驱动。
step.2:安装驱动
你可以选择,安装所有推荐的驱动,如下命令
$ sudo ubuntu-drivers autoinstall
你也可以选择,只安装其中一个驱动,命令如下
$ sudo apt install nvidia-340
OK 驱动安装完成,重新启动,查看系统配置—》详细信息—》关于 ,图形处理是否对应于自己的独立显卡。
2. 装CUDA:
开始安装:
step .1 GCC 降级:
由于CUDA 9.0仅支持GCC 6.0及以下版本,而Ubuntu 18.04预装GCC版本为7.3,故手动进行降级:
sudo apt-get install gcc-4.8
sudo apt-get install g++-4.8
装完后进入到/usr/bin目录下
$ls -l gcc*
会显示以下结果
lrwxrwxrwx 1 root root 7th May 16 18:16 /usr/bin/gcc -> gcc-7.3
发现gcc链接到gcc-7.0, 需要将它改为链接到gcc-4.8,方法如下:
sudo mv gcc gcc.bak #备份
sudo ln -s gcc-4.8 gcc #重新链接
同理,对g++也做同样的修改:
ls -l g++*
lrwxrwxrwx 1 root root 7th May 15:17 g++ -> g++-7.3
需要将g++链接改为g+±4.8:
sudo mv g++ g++.bak
sudo ln -s g++-4.8 g++
再查看gcc和g++版本号:
gcc -v g++ -v
均显示gcc version 4.8 ,说明gcc 4.8安装成功。
step. 2 安装cuda ,及其补丁:
输入命令安装Base Installer:
sudo sh cuda_9.1.85_387.26_linux.run
需要注意的是,之前已经安装过显卡驱动程序,故在提问是否安装显卡驱动时选择no,其他 选择默认路径或者yes即可。
然后,继续执行以下操作安装3个 patch :
sudo sh cuda_9.1.85.1_linux.run
sudo sh cuda_9.1.85.2_linux.run
sudo sh cuda_9.1.85.3_linux.run
安装完毕之后,将以下两条加入.bashrc文件中.
sudo vim ~/.bashrc
export PATH=/usr/local/cuda-9.1/bin${PATH:+:$PATH}} #注意,根据自己的版本,修改cuda-9.2/9.0...
export LD_LIBRARY_PATH=/usr/local/cuda-9.1/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}} #注意,根据自己的版本,修改cuda-9.2/9.0...
OK ,那么,到这一步,cuda 就安装完成了
使其生效
source ~/.bashrc
查看是否生效
cat /proc/driver/nvidia/version
nvcc -V
跑一下案例测试,出现pass即成功,失败的话可以重启试试(出现问题可以重启试试,一般可以解决一些问题,重装系统可以解决所有问题,哈哈哈)
cd ~/NVIDIA_CUDA-10.0_Samples/1_Utilities/deviceQuery
sudo make
./deviceQuery
3. 装CUDnn:
step.1 从官网下载cudnn,下载完毕后,切到默认的Downloads文件夹,可以看到 cudnn-9.1-linux-x64-v7.tgz 压缩包,先解压。
step.2 复制cuDNN内容到cuda相关文件夹内
sudo cp cuda/include/cudnn.h /usr/local/cuda/include 注意,解压后的文件夹名称为cuda ,将对应文件复制到 /usr/local中的cuda内
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*