异构系统体系结构原理、模型及应用
文章平均质量分 88
异构计算机框架介绍
高性能计算工程师
做一个极客!
展开
-
第6章 HSA排队模型
本章了解如何将这些内核分派或提交给HSA系统执行。这是HSA队列的工作。HSA队列是一个异步框架,用于构建潜在从属内核的图表,以便在特定的HSA代理上执行。可以为HSA系统内的单个代理或多个代理创建多个队列。内核之间的依赖关系由HSA信号控制。信号代表了所有HSA系统提供的通用解决方案,并支持不同代理之间的低延迟同步和异步通信。为了实现低延迟调度,队列由HSA运行时分配。从那时起,应用程序以体系结构排队语言AQL数据包的形式将工作直接提交给队列。原创 2024-03-12 02:00:00 · 1873 阅读 · 0 评论 -
第4章 HSA运行时
HSA运行时是一种精简的用户模式应用程序编程接口API,它提供了主机将计算内核启动到可用HSA代理程序所必须的接口。它可以分为两类:核心和扩展。HSA核心运行时API旨在支持HSA系统平台体系结构规范所需的操作,并且必须得到任何符合HSA的系统的支持。HSA扩展运行时API可以是HSA认可的或供应商特定的,并且对于符合HSA的系统是可选的。本章首先描述HSA核心运行时API,包括初始化和关闭、通知、系统和HSA代理信息、信号、队列、内存、代码对象和可执行文件,然后是经过HSA认证的运行时API。原创 2024-03-05 02:00:00 · 1189 阅读 · 0 评论 -
第3章 HSAIL 虚拟并行ISA
编写HSAIL与编写CPU汇编语言相似:语言使用加载/存储体系结构,支持基本的整数和浮点操作、分支、原子操作、多媒体操作,并使用固定大小的寄存器池。指令集定义了浮点双精度、单精度和半精度。HSAIL还支持函数指针、虚拟函数、共享虚拟内存、系统原子核用于高效跨设备通信的信号。此外,HSAIL还定义了组内存、层次同步原语(例如,工作组、代理和系统范围同步)以及可用于实现峰值的波前。原创 2024-03-03 09:50:18 · 801 阅读 · 0 评论 -
第2章 HSA概述
HSA在过去三十多年中,已经成为将CPU内核和CPU套接字绑定在一起的共享内存系统体系结构。HSA最初专注于将GPU有效地用作CPU的并行协处理器。后面意识到在GPU上高效运行所需的体系结构特征也适用于许多不同类型的专用处理单元,其中许多已经存在于SOC中。GPU最初是作为IO设备连接到CPU的。HSA基金会成立于2012年,当时SOC内部的GPU核心仍然很难编程。HSA基金会成立是为了解决这个问题,为SOC上所有类型的处理单元的体系结构整合铺平道路。原创 2024-02-29 00:45:00 · 754 阅读 · 1 评论 -
第1章 引言
HSA运行时的核心(必需)功能是管理HSA系统的计算设备(称为HSA代理),在可用的HSA代理上启动计算内核,分配\管理HSA内存,向用户进程报告内核执行,并支持HSA代理之间的通信。通过在延迟敏感的应用上使用CPU,同时在高度并行的吞吐量友好部件上使用GPU,异构计算系统可以获得比传统系统更高的应用性能和能源效率。首先介绍主要的HSA内存分段类型,然后解释如何使用所有权的概念来提供特定设备在一个时间窗口内需要访问的内存位置的性能和能源效率。物理效应的真实建模和仿真需要大量的计算能力。原创 2024-02-25 22:00:00 · 514 阅读 · 0 评论