博文背景
深度学习需要显卡跑运算,安装Tensorflow成了很多人的噩梦,在这里记录安装Tensorflow的旅程,如果你失败了无数次,不妨按照我的做一遍,非常轻松。
具体操作
1.使用ubuntu 20.04
为避免不同硬件环境导致的问题,这里统一使用腾讯云GPU服务器进行实验,成本是1.4元。
2.安装Nvidia-deriver
安装英伟达显卡驱动,这里(2020年11月)我们安装nvidia-driver-440
sudo apt install nvidia-driver-440
安装完成后重启服务器,安装完成后重启服务器,安装完成后重启服务器
3.安装Miniconda
#!/usr/bin/bash
set -e
wget "https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.sh" -O ~/miniconda.sh
bash ~/miniconda.sh -b -p $HOME/miniconda
~/miniconda/bin/conda init $(echo $SHELL | awk -F '/' '{print $3}')
echo 'Successfully installed miniconda...'
echo -n 'Conda version: '
~/miniconda/bin/conda --version
echo -e '\n'
exec bash
4.对conda进行换源
https://github.com/tuna/oh-my-tuna
wget https://tuna.moe/oh-my-tuna/oh-my-tuna.py
python oh-my-tuna.py
5.安装Tensorflow-GPU
折腾cuda和cudnn非常累,动不动就莫名奇妙的错误和版本问题,这么复杂的东西当然交给数据科学家的拯救者conda来完成,下面的步骤在tensorflow 2.2和2.3版本下测试均通过
conda create -n tf python=3.8
pip install -U pip
conda activate tf
pip install -U tensorflow-gpu
conda install cudatoolkit=10.1.243 cudnn=7.6.5
pip install ipython
6.验证安装成功
import tensorflow as tf
print(tf.config.list_physical_devices('GPU'))
如果能显示一个非空的GPU的列表则说明正常
7.开始深度学习之旅
希望这篇博文能帮到未来数据科学家的你。腾讯云竞价实例不支持关机不计费,可以把实例关机后制作镜像,如果无法制作镜像可以提交工单申请这个功能,有的账号不支持制作镜像需要提交工单进行开通,以后要训练模型时直接使用自定义镜像生成实例就可以了。