背景
实验室的服务器内核版本太老了,有一个项目需要升级内核,但是服务器上还有一堆东西不敢随便升级。
于是就准备用docker构建一个镜像,安装CUDA和Python环境,平时ssh连进去炼丹
需求
炼丹必备的cuda肯定是必不可少的,ssh服务器也需要配置,既然准备写一个dockerfile,那python环境和换源之类的也就一块打包到镜像里去得了。
以后谁想炼丹直接新建一个容器,映射好端口之后容器里炼丹的基础设施就都有了。
安装
宿主机安装CUDA驱动
想要容器能用CUDA,宿主机肯定要安装CUDA驱动,这部分就不讲了,好多博客都有。
宿主机安装NVIDIA-CONTAINER-RUNTIME
在https://nvidia.github.io/nvidia-container-runtime/ 查看支持的操作系统和版本,并根据对应选项,添加源,因为我是centos7,所以添加方式为:
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-container-runtime/$distribution/nvidia-container-runtime.repo | \
sudo tee /etc/yum.repos.d/nvidia-container-runtime.repo
然后直接yum install
就可以安装docker cuda驱动
sudo yum