CK-Composable Kernel 下载安装

CK-Composable Kernel 下载安装

本博客原址

AMD 可组合内核库:只需几行代码即可为 AI 应用提供高效的融合内核

CK 库是为 AMD-GPU 所开发的,下载和使用都需要在 AMD-Rocm 环境/平台,如果你的 GPU 并非 AMD 的,是无法下载使用 CK 的。

关于CK库

下载

从 GitHub 存储库下载 CK 源代码并开始构建。 将会得到一个名为composable_kernel的文件夹。

git clone https://github.com/ROCm/composable_kernel.git
cd composable_kernel

安装 (Python + Cmake)

安装Python依赖
cd docs
pip3 install -r sphinx/requirements.txt
python3 -m sphinx -T -E -b html -d _build/doctrees -D language=en . _build/html
查看GPU架构

CK支持的GPU架构有 gfx908;gfx90a;gfx940;gfx941;gfx942;gfx1030;gfx1100;gfx1101;gfx1102

需要查看自己本地(或你的服务器)使用的架构,以下两行代码都可以帮助你明确你所使用的架构。

rocminfo
rocm-smi

我的GPU架构是 gfx942 。因此在下面的cmake配置中,我的 GPU_TARGETS 项为 gfx942

使用Cmake安装

创建构建目录并进入。

mkdir build
cd build

使用以下命令配置cmake, 注意路径,并把 GPU_TARGETS 项更改为你的GPU架构。

cmake \
-D CMAKE_PREFIX_PATH=/opt/rocm \
-D CMAKE_CXX_COMPILER=/opt/rocm/bin/hipcc \
-D CMAKE_BUILD_TYPE=Release \
-D GPU_TARGETS="gfx942"   \
..

构建CK库 并安装CK

make -j
make -j install
示例测试

生成示例和测试

make -j examples tests

生成并运行所有示例和测试

make -j check

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值