HIP编程是什么

冰淇淋烤布蕾

于 2024-07-05 08:57:14 发布

阅读量568

点赞数 12

文章标签：开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zzzzzucc/article/details/140197918

版权

HIP异构编程模型

本次比赛的HIP编程方法，是在类GPU加速器DCU上运行高性能的并行计算。

使用的编程模型是ROCm HIP模型，是C/C++为基础的异构并行编程模型，和CUDA编程类似。

具体在另一篇博客提过：异构计算技术与DTK异构开发套件-CSDN博客

HIP编程模型中有两个部分，在CPU上运行的是主机端host，DCU加速器上运行的是设备端device

主机端代码在CPU运行，入口函数main，使用C/C++编写，HIP使用Runtime API在主机端分配设备显存，管理主机端和设备端的内存拷贝，运行设备端核函数等
设备端代码在加速器DCU上运行，使用扩展的C语法（HIP_C），设备端代码组织成核函数运行
**核函数Kernel：**设备端代码由HIP_C构成并运行在加速器上，被称为核函数

HIP异构程序的实现是什么样的：

将数据从主机端传到设备内存->启动核函数对数据运算->将结果传回CPU

HIP模型线程组织模式

核函数执行模型的三层结构：thread-block-grid

每个核函数启动的线程有唯一的线程ID，可以通过HIP内置的变量hipthreadIdx进行访问。hipthreadIdx设计成三分量矢量，也就是xyz三个轴

一个线程块会被划分为一定数量的线程束，每个线程束有64个线程。

在同一线程束中的线程执行不同的指令，被称为线程束分化，也会影响性能。比如if和else使用，会把不执行的线程禁用闲置，占用线程。

HIP内存层次结构

存储结构有global memory全局内存、shared memory（LDS）共享内存、thread-local memory（寄存器）等

寄存器是对线程私有的，延迟低。共享内存是HIP编程模型提供的可编程缓存，优于全局内存。全局内存是DCU容量最大延迟最高，但是最常用的内存。

HIP代码分解

主机端对设备端显存分配

主机端控制与设备显存间数据的传输

HIP kernel从主机端运行

HIP核函数

CPU代码

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

加速器代码

_global_使核函数在加速器运行

返回值声明必须void

传入参数必须设备端指针和立即数

执行核函数线程是并发的

执行核函数的每个线程拥有独立的thread ID

完整代码示例

冰淇淋烤布蕾

关注

12
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

冰淇淋烤布蕾 CSDN认证博客专家 CSDN认证企业博客

码龄3年

37: 原创

1万+: 周排名

3万+: 总排名

2万+: 访问

: 等级

830: 积分

568: 粉丝

414: 获赞

15: 评论

295: 收藏

私信

关注

热门文章

最新评论

sunshine+moonlight实现副屏
冰淇淋烤布蕾: 然后就有拓展屏了呀，没有的话win+p看看显示模式
sunshine+moonlight实现副屏
断点784: 然后呢
您选择的驱动器或UNC共享不存在或不可访问。请选择其他位置。
冰淇淋烤布蕾: {771FD6B0-FA20-440A-A002-3B3BAC16DC50}_is1 是 Windows 注册表中与已安装的应用程序相关的一个条目，通常用来标识某个特定的软件安装。如果知道是哪个软件报错的话，可以一个个找找，通过注册表项下的 DisplayName 值找到不正确的那个软件。比如我是VSCode路径有问题，就找DisplayName是VSCode的。图片里也可以看到右侧有个DisplayName写了软件是VSCode。
您选择的驱动器或UNC共享不存在或不可访问。请选择其他位置。
吃不到棉花糖: 我也没有77开头的表
sunshine+moonlight实现副屏
YSHTD: 我在sunshine里把副屏的\\.\DISPLAY1加上后就显示503报错

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。