本文是在宿主机Ubuntu16.04上拉取cuda10.1-cudnn7-ubuntu18.04的镜像,在容器中通过Miniconda3创建python3.7.5的环境并成功安装mindspore_gpu_1.0.1;
一、前期踩过的坑
二、安装成功的流程
【1】拉取cuda10.1-cudnn7-ubuntu18.04的镜像
【2】镜像内创建容器此处一定是nvidia-docker创建
【3】在容器内安装Miniconda
【4】使用conda创建python3.7.5的虚拟环境并激活
【5】通过可执行文件安装mindspore_gpu_1.0.1.whl并测试
一、前期踩过的坑
在ubuntu上安装GPU版本mindspore的具体流程:
主要有以下几点:
-
Ubuntu18.04(系统版本至少为18.04及以上) :
基于我使用的是共用版Ubuntu16.04的服务器,无法直接升级,只能通过容器方式,拉取Ubuntu18.04的镜像; -
cuda10.1 (cuda版本必须为10.1):
-
cudnn >= 7.6 (cudnn7.6.5可行,但cudnn8是会报错的):
因Nvidia提供了cuda+cudnn+ubuntu的镜像,
所以可以一次性拉取需要的cuda10.1-cudnn7-ubuntu18.04的镜像;
因要求的是cudnn>=7.6,所以最开始拉取的是cudnn8版本的,一直报错libcudnn.so.7: cannot open shared object file: No such file or directory
,后改为cudnn7版本就没报错了; -
devel和runtime版本区别:本文选择devel版
找到cuda10.1-cudnn7-ubuntu18.04,(cudnn7它标明的是cudnn7.6.5)发现有两个版本cuda devel和cuda runtime:
官方解释:
devel是说只涵盖了开发bai所需的所有工具,包含编译、debug等,以及编译需要的头文件、静态库。
runtime是说只涵盖了运行环境的最小集合,例如动态库等
所以runtime的镜像大小会比devel小一些 -
docker与nvidia-docker的区别