titanRTX安装bubantu18.04 内核 驱动 cuda cudnn ananconda python tensorflow-gpu

系统:ubantu18.04
内核:nvidia-440(已试390不兼容)
驱动:Linux 4.18.0-15-generic
cuda:10.1
cudnn:7.6.1
annaconda:3.5.2
python:3.6.5
tensorflow:2.1(已试1.4  1.9.0   1.12  1.13.1   1.14  2.1  报错) tensorflow支持cuda10.1

成功运行版本:
cuda:9.0
cudnn:7.0.5
annaconda:3.5.2
python:3.6.5
tensorflow-gpu:1.5.0

1 查看命令
lspci -vnn | grep -A6 "VGA" 查看显卡
lspci | grep -i nvidia
lspci | grep 'VGA'查看显卡
cat /proc/meminfo  查看内存
cat /proc/cpuinfo  查看cpu
cat /proc/cpuinfo | grep name
cat /proc/cpuinfo | grep name | cut -f2 -d: | uniq -c查看cpu型号
df -lh 查看硬盘


2 显卡驱动安装
lspci | grep -i nvidia查看显卡信息1e02为16进制 到http://pci-ids.ucw.cz/read/PC/10de/1e02查看对应版本
lshw -numeric -C display  查询电脑最适合的显卡驱动版本(1)
ubuntu-drivers devices    查询电脑最适合的显卡驱动版本(2)
cd /usr/src 查看已有驱动
ls
uname -sr查看当前系统内核
nvidia-smi查看显卡信息证明安装成功
添加驱动源:
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
卸载干净所有的nvidia驱动:sudo apt-get remove --purge nvidia-*
sudo ubuntu-drivers autoinstall 自动安装
sudo apt install nvidia-340 安装特定版本
sudo dkms install -m nvidia -v 440.82  安装显卡驱动
sudo aptitude install nvidia-driver-440   安装驱动报错后使用aptitude安装


sudo apt install nvidia-utils-390
sudo apt-get install dkms


3 cuda安装卸载
cat /usr/local/cuda/version.txt  查询cuda版本
nvidia-smi查看driver runtime版本     
nvcc -V查看toolkit版本
sudo wget http://developer.download.nvidia.com/compute/cuda/10.1/Prod/local_installers/cuda_10.1.243_418.87.00_linux.run    下载
sudo sh cuda_10.1.243_418.87.00_linux.run  安装
命令后面加--override 报错Toolkit:  Installation Failed. Using unsupported Compiler
sudo ./cuda-uninstaller 高版本卸载cuda
sudo /usr/local/cuda-11.0/bin/uninstall_cuda_11.0.pl 低版本卸载cuda
sudo rm -rf /usr/local/cuda-8.0/
添加环境变量vi ~/.bashrc  或者sudo gedit ~/.bashrc
export PATH="/usr/local/cuda-9.0/bin:$PATH"
export LD_LIBRARY_PATH="/usr/lcoal/cuda-9.0/lib64:$LD_LIBRARY_PATH"
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-9.0
source ~/.bashrc  使其生效
终端输入验证,出现Result = PASS则表示安装成功通过。
cd /usr/local/cuda-9.0/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery


4 cudnn安装卸载
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2查看cudnn版本
进入解压文件夹:
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
sudo chmod a+r /usr/local/cuda/include/cudnn.h

sudo rm -rf /usr/local/cuda/include/cudnn.h 卸载
sudo rm -rf /usr/local/cuda/lib64/libcudnn  卸载
建立软连接(配置环境变量)
在/usr/local/cuda/lib64目录下打开终端,执行如下指令:
sudo chmod +r libcudnn.so.7.0.5
sudo ln -sf libcudnn.so.7.0.5 libcudnn.so.7  
sudo ln -sf libcudnn.so.7 libcudnn.so     
sudo ldconfig
或者sudo ldconfig /usr/local/cuda-9.0/lib64
或者sudo ln -sf /usr/local/cuda-9.0/lib64/libcudnn.so.7.0.5 libcudnn.so.7
sudo ln -sf /usr/local/cuda-9.0/lib64/libcudnn.so.7 libcudnn.so   

5 anaconda安装:
bash Anaconda3-5.2.0-Linux-x86_64.sh
yes yes yes no
Do you wish to proceed with the installation of Microsoft VSCode? [yes|no]”,输入no
卸载:uninnstall  删除包 注释环境变量
ananconda3安装位置:/home/dell/anaconda3?

6 python解释器位置:
which python或者whereis python
/home/dell/下载/yes/bin/python
python 查看python版本
进入”/usr/bin”目录下,输入”ls -l | grep python     查看python默认安装版本 软连接


7 运行pycharm:
source ~/.bashrc
cd 下载/pycharm-professional-2018.3.5//pycharm-2018.3.5/bin/
sh pycharm.sh

8 清华镜像源安装tensorflow:
pip install tensorflow-gpu==1.12 -i https://pypi.tuna.tsinghua.edu.cn/simple
报错使用清华园新命令:
pip install   --index-url https://pypi.tuna.tsinghua.edu.cn/simple/ tensorflow-gpu==1.12
pip list 查看pip包


 

GRUB_DEFAULT=0
GRUB_TIMEOUT_STYLE=hidden
GRUB_TIMEOUT=0

echo $LD_LIBRARY_PATH  输出环境变量路径
sudo ldconfig /usr/lcoal/cuda-10.1/lib64
sudo ldconfig /usr/lcoal/cuda/lib64
sudo ln -sf /usr/local/lib/libcudnn.so.7.6.1 /usr/local/lib/libcudnn.so.7
/sbin/ldconfig.real: /usr/local/cuda-10.1/targets/x86_64-linux/lib/libcudnn.so.7 不是符号链接

 

bug1:因为您要求某些软件包保持现状,就是它们破坏了软件包间的依赖关系

解决方法:换一下安装方式

sudo apt-get install aptitude
sudo apt-get update
sudo aptitude install  ...

 

bug2:ImportError: libcublas.so.8.0: cannot open shared object file: No such file or directory
8.0 cuda10.0向下兼容

原因:cuda 安装失败或版本不对    buda环境变量   cudnn软连接问题   tensorflow-gpu版本不对

 

bug3:
E: 无法获得锁 /var/lib/dpkg/lock-frontend - open (11: 资源暂时不可用)
E: Unable to acquire the dpkg frontend lock (/var/lib/dpkg/lock-frontend), is another process using it?
解决方法:ps -e|grep apt-get

sudo kill 进程号

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值