Centos装机+GPU驱动

实际进行了一次装机,虽然网上教程很多,但是遇到的某个问题卡了很久,聊做记录,方便自己以后使用。
1.安装Centos系统,使用U盘启动盘安装,过程简单。
2.安装CUDA及CUDNN。

  1. 下载CUDA。我这里安装的是CUDA10.2,通过官网下载。下载地址 其中,rpm(network)似乎固定下的是最新版本,因为我对版本有要求,因此通过runfile(local)下载,安装。(以后装什么优先去官网找资料,而不应该第一反应就是百度。)
  2. 禁用nouveau,安装依赖如GCC,kernel-header等。这一步后安装报错。查看cuda-installer.log日志,发现是nvidia安装问题,继续查看nvidia-installer.log。报错如下:
    Unable to find the kernel source tree for the currently running kernel...
  3. 最初以为kernel-header版本不对的原因,所有的教程里都写着安装与当前运行内核版本一样的kernel-headers。我的系统版本与kernel-headers版本大版本一致,但是后面稍有不同,以为这样是不行的。按照网上的方法(yum install "kernel-devel-uname-r == $(uname -r)"),显示没有相应的版本。由于我的是内核版本新于kernel-headers版本,因此更新内核版本的方法也不合适。试着内核降级,但是没有成功(==)。卡了很久,抱着试一试的态度,在安装CUDA时指定了kernel-headers的位置,出乎意料的就成功了,emmmm…
    sudo sh cuda_10.2.89_440.33.01_linux.run --kernel-source-path=/usr/src/kernels/3.10.0-1160.24.1.el7.x86_64/
  4. 安装CUDNN,根据网上的教程下载后复制了一些文件去到相应的路径,搞定。

3.安装docker
安装docker也不复杂。docker分为CE(社区版)和EE(企业版),安装CE就可以了,我安装的是docker19。需要注意的是,如果要使用GPU,则还需要安装nvidia-container-toolkit,这样才可以使用命令docker run --gpus all等。

curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.repo | sudo tee /etc/yum.repos.d/nvidia-docker.repo
sudo yum install -y nvidia-container-toolkit
sudo systemctl restart docker

查了一下资料,nvidia-container-toolkit相对nvidia-docker来说更新,更好用。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值