【论文阅读】Retargeting and Respecializing GPU Workloads for Performance Portability
GPU 硬件的演变CUDA 编程模型和语法随时间相对稳定,但底层 GPU 硬件已经显著发展,增加了许多新特性和指令。性能可移植性问题即使 CUDA 编写的 GPU 内核能够在更新的 NVIDIA GPU 上运行,它们也可能因为kernel尺寸与目标架构不匹配而无法达到类似的利用率。编译器机制的提出作者提出了一种基于编译器的机制,通过自动调整每个 GPU 线程的工作量以及内存和寄存器资源的使用量,来“调整”GPU 程序以适应特定架构。MLIR 编译器基础设施。
原创
2024-08-20 14:20:53 ·
1220 阅读 ·
0 评论