ubuntu系统下,基于gpu和python做深度学习,需要安装的内容及作用:
1.显卡驱动:调用显卡的基础,安装成功后,可以调用nvidia-smi指令,查看显卡驱动版本
2.cuda和cudnn:nvidia为显卡加速计算提供的库,cuda和显卡驱动是有对应关系的
为了便于多个不同代码的调试,我们可能需要多个版本的cuda,只要将多个cuda都解压到/usr/local目录即可,具体使用哪个,可以通过用户的环境变量配置,使不同的文件夹(用户/环境)使用不同的cuda版本。
用户环境变量修改如下:vim ~/.bashrc
找到其中的cuda的定义,更改指向路径,即可更改调用的cuda版本
修改完还后,运行nvcc -V指令,可以查看当前cuda的版本
关闭终端,新开终端可生效
3.anaconda:python的环境管理工具,通过anaconda管理多个版本的python环境很方便,比直接安装python和pip要清晰清楚。
anaconda多环境管理
conda env list指令可查看所有环境
conda create -n name python=3.6可建立新的环境
conda activate name可激活指定环境
conda install xxx安装指定的包
tensorflow,pytorch等架构,涉及python版本/cuda版本兼容问题,可从下面网址查看有哪些可用的版本,再配置环境,环境配置错误,则无法找到目标文件,无法安装。
查看清华源中版本对应关系的网址:https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/linux-64/
比如:安装pytorch时,可使用如下指令
conda install pytorch=1.0.1 torchvision cudatoolkit=8.0
但如果使用
conda install pytorch=1.0.1 torchvision cudatoolkit=9.0
则无法安装,因为清华的源中,没有用cuda9.0编译的pytorch
tensorflow本身和cuda版本存在对应关系,如下图:
4.pycharm:集成开发环境,查阅代码方便。