ubuntu16.04安装tensorflow以及pytorch方法
cuda与cudnn安装
nvidia驱动、cuda、cudnn、tensorflow、pytorch版本的对应关系
nvidia驱动和cuda的版本对应关系,可以参考nvidia与cuda关系,如下所示:
cuda与cudnn版本对应关系,可以参考cuda与cudnn关系,如下所示:
CUDA版本与Ubuntu 版本,以及GCC版本对应关系,可以参考cuda8.0、cuda9.0、cuda10.0,如下所示:
tensorflow不同版本要求与CUDA及CUDNN版本对应关系,可以参考tensorflow环境,如下所示:
ubuntu16.04+cuda10.0+cudnn+nvidia驱动安装
cuda10.0下载地址:https://developer.nvidia.com/cuda-toolkit-archive
选项如下:
cuda10.0安装:
#第一种方法
chmod +x cuda_10.0.130_410.48_linux.run
sudo ./cuda_10.0.130_410.48_linux.run
#第二种方法
sudo apt install nvidia-cuda-toolkit
#然后进行:
#配置环境变量中的路径变量(PATH
sudo gedit ~/.bashrc
export PATH="/usr/local/cuda-11.0/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda-11.0/lib64:$LD_LIBRARY_PATH"
source ~/.bashrc
cudnn下载地址:https://developer.nvidia.com/rdp/cudnn-archive
登录需要帐号和密码,可以自行设置。
下载与cuda版本对应的cudnn版本:
下载后进行安装:
#解压.tgz得到cuda目录,注意所有 x 都代表版本号
cd cuda/include
#复制头文件到对应cuda版本的include文件夹下
sudo cp cudnn.h /usr/local/cuda-10.0/include
#或者 用于10.2以及以上版本
sudo cp -r ./* /usr/local/cuda-10.0/include
cd cuda/lib64
#复制动态链接库
sudo cp lib* /usr/local/cuda-10.0/lib64/
cd /usr/local/cuda-10.0/lib64/
#删除原有动态文件
sudo rm -rf libcudnn.so libcudnn.so.7
#生成软衔接
sudo ln -s libcudnn.so.7.6.4 libcudnn.so.7
sudo ln -s libcudnn.so.7 libcudnn.so
Nvidia驱动下载:https://www.nvidia.cn/Download/index.aspx?lang=cn,或者: https://www.nvidia.cn/geforce/drivers/ 如下图在Nvidia官网搜索与自己电脑显卡匹配的驱动:
查看自己电脑推荐的驱动版本
输入以下命令,检查系统推荐的驱动版本
ubuntu-drivers devices
输出如下:
== /sys/devices/pci0000:00/0000:00:01.0/0000:01:00.0 ==
modalias : pci:v000010DEd00001C8Dsv000017AAsd000039D1bc03sc02i00
vendor : NVIDIA Corporation
model : GP107M [GeForce GTX 1050 Mobile]
manual_install: True
driver : nvidia-driver-418-server - distro non-free
driver : nvidia-driver-460-server - distro non-free
driver : nvidia-driver-460 - distro non-free
driver : nvidia-driver-390 - distro non-free
driver : nvidia-driver-470 - distro non-free recommended
driver : nvidia-driver-450-server - distro non-free
driver : xserver-xorg-video-nouveau - distro free builtin
== /sys/devices/pci0000:00/0000:00:14.0/usb1/1-11/1-11:1.1 ==
modalias : usb:v0BDAp0821d0200dcE0dsc01dp01icE0isc01ip01in01
vendor : Realtek Semiconductor Corp.
driver : rtl8812au-dkms - distro free
然后根据建议,选择最高版本的driver下载
进行nvidia驱动安装:
第一种方法:
chmod +x NVIDIA-Linux-x86_64-430.50.run # 其中430.50是驱动的版本号
sudo ./NVIDIA-Linux-x86_64-430.50.run
如果安装过程中出现如下错误:
ERROR: The Nouveau kernel driver is currently in use by your system. This
driver is incompatible with the NVIDIA driver, and must be disabled
before proceeding. Please consult the NVIDIA driver README and your
Linux distribution's documentation for details on how to correctly
disable the Nouveau kernel driver.
需要禁用The Nouveau kernel driver,方法可以参考文章:
文章
或者执行以下语句:
sudo ./NVIDIA-Linux-x86_64-430.50.run -no-x-check #安装驱动时关闭X服务
sudo ./NVIDIA-Linux-x86_64-430.50.run -no-nouveau-check #安装驱动时禁用nouveau
sudo ./NVIDIA-Linux-x86_64-430.50.run -no-opengl-files #只安装驱动文件,不安装OpenGL文件
如果出现:
You appear to be running an X server
可以进行如下步骤
先到NVIDIA 官网上下载驱动文件(.run 格式)
1.按住CTRL+ALT+F1~F6 进入命令行模式 F1~F6会有一个进去
2. 命令行模式需要先输入 用户"root" 再输入密码* ,进入root用户
2.sudo service lightdm stop 或者 sudo stop lightdm
3.sudo init 3
4.安装驱动程序:#: sudo ./NVIDIA-Linux-x86_64-177.67-pkg2.run //当前目录下执行NVIDIA驱动程序
5.按照提示安装完成,简单方法重启就好了。命令:sudo reboot
第二种方法:
自动安装
sudo ubuntu-drivers autoinstall
如果报缺失依赖包,可以执行(万能的,无论装什么,使用此句话就能把缺失的依赖进行安装):
sudo apt --fix-broken install
查看安装是否成功:
sudo reboot
重启后
watch -n 0 nviddia-smi
第二种方法:
根据推荐安装指定版本
先查看推荐的版本
ubuntu-drivers devices
再进行安装制定版本
sudo apt install nvidia-driver-470 #安装470版本
sudo apt install nvidia-driver-510 #安装510版本
驱动卸载方法:
sudo ./NVIDIA-Linux-x86_64-430.50.run --uninstall #利用安装包进行卸载
sudo apt-get --purge remove nvidia*
sudo apt autoremove
sudo reboot
Ubuntu16.04 +双cuda和cudnn安装:
本地ubuntu16.04同时安装cuda8.0和cuda10.0,在使用时,进行切换方法为:
切换到cuda8.0环境:
cd /usr/local
sudo rm -rf /usr/local/cuda
sudo ln -s /usr/local/cuda-8.0 /usr/local/cuda
stat cuda #显示当前使用的cuda版本
切换到cuda10.0环境:
cd /usr/local
sudo rm -rf /usr/local/cuda
sudo ln -s /usr/local/cuda-10.0 /usr/local/cuda
stat cuda
在以上所有的安装完成后,需要查看当前系统的环境信息:
查看ubuntu系统信息:
lsb_release -a
查看linux内核信息:
uname -a
查看cuda、cudnn版本信息:
cat /usr/local/cuda/version.txt #查看cuda
#或者
nvcc -V
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2 #查看cudnn
#或者
cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
查看GPU型号:
lspci | grep -i nvidia
查看NVIDIA驱动版本:
sudo dpkg --list | grep nvidia-*
#或者
cat /proc/driver/nvidia/version
查看显卡驱动是否安装:
glxinfo | grep rendering
#如果结果是“yes”,证明显卡驱动已经成功安装。
#如果提示有问题,可能是系统里面没有安装mesa-utils,安装过程:在终端输入命令:sudo apt-get install mesa-utils
#然后再运行命令:glxinfo | grep rendering
Anaconda3.0安装以及创建python虚拟环境
Anaconda3.0安装与卸载
anaconda3.0下载地址:https://mirrors.ustc.edu.cn/anaconda/archive/ (中科大源)
推荐下载“Anaconda3-5.3.1-Linux-x86_64.sh”版本。
安装anaconda3.0到指定的位置:
bash Anaconda3-5.3.1-Linux-x86_64.sh -p home/anaconda3/ -u #这样即可将anaconda 安装在“ ./anaconda3/”目录下
安装成功后需要将其添加到系统环境中:
首先打开bashrc文件:
sudo gedit ~/.bashrc
然后在末尾添加:
export PATH=/home/anaconda3/bin:$PATH
最后进行source使其生效:
source ~/.bashrc
卸载Anaconda3.0的方法:
首先删除Anaconda3整个安装文件夹
rm -rf anaconda3
然后在清除系统环境变量,打开bashrc文件
sudo gedit ~/.bashrc
找到如下内容进行删除:
export PATH=/home/anaconda3/bin:$PATH
# added by Anaconda3 5.3.1 installer
# >>> conda init >>>
# !! Contents within this block are managed by 'conda init' !!
__conda_setup="$(CONDA_REPORT_ERRORS=false '/home/anaconda3/bin/conda' shell.bash hook 2> /dev/null)"
if [ $? -eq 0 ]; then
\eval "$__conda_setup"
else
if [ -f "/home/anaconda3/etc/profile.d/conda.sh" ]; then
. "/home/anaconda3/etc/profile.d/conda.sh"
CONDA_CHANGEPS1=false conda activate base
else
\export PATH="/home/anaconda3/bin:$PATH"
fi
fi
unset __conda_setup
# <<< conda init <<<
最后source一下:
source ~/.bashrc
创建python虚拟环境
查看已有的虚拟环境:
conda env list #结果会有一个“base”环境,是anconda默认创建的
新建虚拟环境:
conda create -n env_name python=3.7 #需要指定使用的python版本,指定后会创建一个新的干净的指定版本的python环境,如果不指定会使用anaconda自带的python环境,那么就不纯净,不建议使用。
进入虚拟环境:
#进入虚拟环境
source activate env_name
给新环境安装库:
#需要先进入,然后才能安装
conda install requests-name #requests-name库名
或者
pip install requests-name
新环境中卸载库:
pip uninstall requests-name
查看新环境中已经安装的库:
conda list
#或者
pip list
导出虚拟环境的配置信息:
#在anaconda里面使用了独立的环境来开发项目,项目开发完成以后,需要把项目所需的环境导出,以便于迁移
#同样先进入虚拟环境
conda env export > environment.yaml #也可以导入到xxx.properites文件
重新创建一个虚拟环境通过导入外界的配置信息:
conda env create -f environment.yaml
退出虚拟环境:
#退出虚拟环境
source deactivate
删除虚拟环境:
conda remove -n your_env_name(虚拟环境名称) --all
安装tensorflow
gpu版本的tensorflow安装:
source activate env_name
pip install tensorflow-gpu==1.15.2
然后在虚拟环境中安装常用的库:
pip install matplotlib
pip install pandas
pip install keras
pip install opencv-python
安装pytorch
conda install pytorch torchvision cudatoolkit=10.0 #表示安装cuda==10.0版本的pytorch
pycharm中使用虚拟环境
在pycharm中进行操作:
File->Settings->Project->Project Interpreter->(设置符号)Adding …
然后看到下图:
在Interpreter中选择anaconda3.0虚拟环境的python。例如,本地的在:
/home/anaconda3/envs/tf-env/bin/python