如果你已经在windows系统上,用N卡可以成功跑深度学习了的话,那么看这篇文章可能会更好理解一些。其实用ubuntu和A卡没那么复杂,只不过现在大多数人都用N卡,所以教程比较少。
参考的在我的收藏里面,有问题可以评论区交流以下,我写的也不全面,就是一步一步探索着弄得
--------------------------------------------------------------------------------------------------------------------------------
首先介绍一下我的电脑情况:CPU是AMD的5600,显卡是6750GRE/10G。如果跑深度学习的话需要装一个Ubuntu系统,这里我给电脑装了双系统,因为windows还要用来打游戏。
=========================================================================
第一步:装双系统。首先单击你的此电脑,然后选择管理,点击磁盘管理,然后选择一个磁盘,右键点击压缩卷,选择你想要的大小就行了。这里建议至少给150G,因为安装完显卡驱动,conda,pycharm这些就要100G了。这样你的ubuntu系统就会装在你新分出来的这个区域。具体步骤参考这篇文章:Ubuntu20.04安装详细图文教程(双系统)_ubuntu20.04安装教程-CSDN博客。要注意的是,我一开始也用的这里面的20.04系统,但是装驱动的时候有问题,所以我去官网下载的最新的系统,https://cn.ubuntu.com/download我下载的是24.04.2那个版本的。然后先把U盘插到电脑上,在开机,然后进入bios模式,选择用u盘启动,这一部分需要自己去探索一下,每个人的电脑不一样。然后会让你选择ubuntu,或者是一个禁用显卡的ubuntu,因为的电脑没有核显,所以要选禁用显卡的那个,不然进去是黑屏,有核显的小伙伴可以试一下。进去之后按照上面那个教程安装系统就行了。分区那里我也没看懂。
第二步:装显卡驱动。去AMD驱动官网下载就可以,注意选择系统的版本。在下面搜索显卡那里没有找到我的显卡对应的linux驱动,所以直接去上面那个linux驱动下载就行了。系统选择的24版本,驱动也要选择24的。 按人AMD Radeon 和 Radeon PRO 显卡 Linux® 驱动程序 ubuntu系统安装AMD独显驱动适用于5,6,7000系显卡_哔哩哔哩_bilibili 然后按照这个视频里面的步骤安装显卡,从要先安装在AMD官网下载那个包,然后才是安装显卡。如果提示你显卡需要30G应该是正常的,因为我也是30G。(他这个没有图形化的安装界面就很烦人)如果你是只有独显的小伙伴,安装完重启后显示正常了,那么就是安装成功了,也可以去设置里面查一下能不能识别到显卡。可以用
rocm-smi
命令查看以下,如果能输出信息就是成功了。
第三步:安装pycharm,anaconda。 pycharm就在官网下载就行,记得选择linux版本。然后破解教程在这里
conda也是去官网安装,都没有图形化的安装界面,都是要用命令安装。
第四步:安装rocm
https://download.pytorch.org/whl/torch/
选择教程中的本地安装那个,然后注意rocm版本要和你的显卡版本一样。rocm版本怎么查看那个命令没有收藏到,等我找到了再更新。如果你的pycharm安装好了或者有python的话,可以用这个指令查看:
torch.version.hip
像我的rocm为6.1,下载torch+rocm也要是6.1的。
(应该是这样,因为我在安的时候比较混乱,忘记顺序了)
然后我这里报错了,还要安装一个东西,才能安装torchhttps://download.pytorch.org/whl/pytorch-triton-rocm/
他报错了之后提示要3.0.0的,就从这个网站下载3.0.0的版本安装之后在安装torch就没问题了。
其他:
这篇文章里面从4-7把每个指令输一遍,我也不知道有没有用,反正我输了最后成功了
其中这个指令提示没有文件不用管,因为我的也没有。
/opt/rocm/opencl/bin/x86_64/clinfo
如果最后运行程序的时候报错的话添加这个
import os
os.environ["HSA_OVERRIDE_GFX_VERSION"] = "10.3.0"
之前那篇安装torch的文章里面有写,如果安装 了torch后识别不到显卡,可以重启一下
最后测试一下:如果测试后显卡,torch都能识别,但是还报错,就在代码前面添加一下这两句代码:
import os
os.environ["HSA_OVERRIDE_GFX_VERSION"] = "10.3.0"
=======================================================================有问题就去搜就行了,我这里面有些可能也是错的,但是最后程序还是成功跑起来了。其他显卡应该 也都可以。