一、系统支持
MD ROCm平台旨在支持以下操作系统:
- Ubuntu 20.04.1(5.4和5.6-oem)和18.04.5(内核5.4)
- CentOS 7.9(3.10.0-1127)和RHEL 7.9(3.10.0-1160.6.1.el7)(使用devtoolset-7运行时支持)
- CentOS 8.3(4.18.0-193.el8)和RHEL 8.3(4.18.0-193.1.1.el8)(不需要devtoolset)
- SLES 15 SP2
注意:
- 不再支持低于18的Ubuntu版本。
- AMD ROCm仅支持Ubuntu的长期支持(LTS)版本。LTS以外的版本也可以与ROCm一起使用,但是,它们不受官方支持。
查看linux内核:
cat /proc/version
查看linux发行版本:
cat /etc/issue
二、硬件支持
目前最新版本的ROCm为v4.1.1
ROCm正式支持使用以下芯片的AMD GPU:
- GFX9 GPU
“ Vega 10”芯片,例如AMD Radeon RX Vega 64和Radeon Instinct MI25
“ Vega 7nm”芯片,例如在Radeon Instinct MI50,Radeon Instinct MI60或AMD Radeon VII,Radeon Pro VII上- CDNA GPU
MI100芯片,例如AMD Instinct™MI100- GFX8 GPU
“ Polaris 11”芯片,例如AMD Radeon RX 570和Radeon Pro WX 4100
“ Polaris 12”芯片,例如AMD Radeon RX 550和Radeon RX 540上的芯片- GFX7 GPU
“夏威夷”芯片,例如AMD Radeon R9 390X和FirePro W9100
GFX8 GPU需要PCI Express 3.0(PCIe 3.0),并支持PCIe原子。这需要CPU和主板的支持。GFX9 GPU默认要求PCIe 3.0支持PCIe原子,
支持的CPU如下:
AMD锐龙CPU
AMD锐龙APU中的CPU
AMD锐龙Threadripper CPU
AMD EPYC CPU
Intel Xeon E7 v3或更高版本的CPU
Intel Xeon E5 v3或更高版本的CPU
Intel Xeon E3 v3或更高版本的CPU
英特尔酷睿i7 v4,酷睿i5 v4,酷睿i3 v4或更新的CPU(即Haswell系列或更新的CPU)
一些Ivy Bridge-E系统
其他具体的硬件和软件支持可详见:
https://github.com/RadeonOpenCompute/ROCm#AMD-ROCm-Documentation-Updates
小编的硬件和系统版本如下:
三、ROCm安装
1、更新系统库:
sudo apt update
sudo apt dist-upgrade
sudo apt install libnuma-dev
sudo reboot
2、添加ROCm apt存储库
对于基于Ubuntu的基于Debian的系统,请按以下方式配置Debian ROCm存储库:
注意:公钥已更改以反映新位置。您必须更新到新位置,因为将来的发行版中将删除旧密钥。
旧密钥:https : //repo.radeon.com/rocm/apt/debian/rocm.gpg.key
新密钥:https : //repo.radeon.com/rocm/rocm.gpg.key
wget -q -O - https://repo.radeon.com/rocm/rocm.gpg.key | sudo apt-key add -
echo 'deb [arch=amd64] https://repo.radeon.com/rocm/apt/debian/ xenial main' | sudo tee /etc/apt/sources.list.d/rocm.list
3、安装ROCm元软件包。
更新存储库列表,安装rocm-dkms元软件包并重启电脑:
sudo apt update
sudo apt install rocm-dkms && sudo reboot
4、验证是否安装成功。
重新启动系统后,运行以下命令以验证ROCm安装是否成功。如果您看到两个命令都列出了您的GPU,则表示安装成功。
sudo /opt/rocm/bin/rocminfo
sudo /opt/rocm/opencl/bin/clinfo
注意:要运行ROCm程序,请在您的PATH中添加ROCm二进制文件。
echo 'export PATH=$PATH:/opt/rocm/bin:/opt/rocm/rocprofiler/bin:/opt/rocm/opencl/bin' | sudo tee -a /etc/profile.d/rocm.sh
5、从Ubuntu卸载ROCm软件包
如果要安装新版本的ROCm,官方目前不支持直接升级,如要先卸载老版本,再重新安装新版本。
要从Ubuntu 20.04或Ubuntu 18.04.5卸载ROCm软件包,请运行以下命令:
sudo apt autoremove rocm-opencl rocm-dkms rocm-dev rocm-utils && sudo reboot
参考文献:
https://github.com/RadeonOpenCompute/ROCm#AMD-ROCm-Documentation-Updates
https://rocmdocs.amd.com/en/latest/Installation_Guide/Installation-Guide.html#ubuntu