很多做ai和数据挖掘的组都需要用到比较新的pytorch;但是服务器上的默认版本并不那么先进,于是我们就需要自己配置cuda;后续可以在多个cuda 版本中进行切换。
我们实验室的配置ubuntu x86-64系统版本16.04 这个还是比较重要的,因为cuda 的一些版本如11.4要求服务器的系统版本要超过18.04,所以在选择cuda之前记得check系统的版本
可以使用lsb_release命令查看版本号
lsb_release -a
顺带一提 我使用的是MobaXterm SSh客户端,不过linux系统使用代码控制,就算你直接在shell里ssh所有的操作是一样的哈。苹果系统还没有使用过。
然后我们选择要安装的cuda 注意一定要按照复现文章需要的pytorch版本去安装对应的cuda;在安装之前 先看一下是不是支持。使用经典命令 nvidia-smi
需要注意的是 这里的Driver Version是已经安装的gpu驱动版本。右边的CUDA Version是这个驱动最高支持的cuda 版本 但是需要注意的是,这个版本操作系统不一定对的上。而另一个查看cuda版本的命令 nvcc -V 看到的版本可能与smi显示的版本不一样,使用过程中的cuda版本以nvcc的为准哈,我们实验室默认安装的是10.2版本的cuda 如果没有特别的需要应该足够了,对ncvv显示的版本满意的同学们可以自行移步到安装pytorch进行阅读。
之后我们去英伟达的官网下载cuda toolkit;这里我们以cuda toolkit 11.3为例