操作系统论文导读（二十）：Making Powerful Enemies on NVIDIA GPUs

最新推荐文章于 2025-05-22 20:04:20 发布

D了一天bug忘了编译

最新推荐文章于 2025-05-22 20:04:20 发布

阅读量1k

点赞数 12

分类专栏： OS/体系结构论文导读与学习笔记文章标签：算法 GPU 实时系统协议

本文链接：https://blog.csdn.net/qq_52505851/article/details/139604881

版权

RTSS-2022: Making Powerful Enemies on NVIDIA GPUs

环境实现（A. Environment Implementation）

实施细节

敌人程序的实现（B. Enemy Implementation）

计算敌人模板（Compute Enemy Template）

内存敌人模板（Memory Enemy Template）

敌人程序的评估（C. Enemy Evaluation）

占用内核（Occupation Kernels）

灵敏度（Sensitivity）

通用实验结构（D. Generic Experiment Structure）

一、文章核心

这篇文章的核心是提出了一种基于“敌人程序”的方法，用于更准确地估计GPU任务在并发执行时的最坏情况执行时间（WCET）。文章主要解决了GPU并发任务之间的资源争夺导致的执行时间不确定性问题。通过实验驱动的方法，设计了能够最大化干扰GPU资源的敌人程序，并通过大量实际GPU基准程序验证了这些程序的有效性。文章的主要贡献包括提出了一种新的实验方法论，识别和定义了多种GPU干扰通道，并提供了详细的实验结果，证明这些敌人程序在增加任务执行时间方面比现有基线方法更有效。

二、文章背景

背景介绍

现代图形处理器（GPU）由于其强大的并行计算能力，越来越多地被用于安全关键的实时系统中，比如自动驾驶车辆。这些系统中的任务通常需要高性能计算，因此GPU成为了理想的计算资源。但是，在同一个GPU上并行执行多个计算任务（称为“内核”）会导致资源争夺问题，进而使得任务的执行时间变得不确定，这种现象被称为“干扰通道”。

干扰通道

干扰通道是指多个并发任务可能共享的硬件资源，例如计算单元、缓存和寄存器。这些资源的共享会使得一个任务的执行时间受到其他任务的影响，增加了实时系统中执行时间分析的复杂性。

研究问题

在实时系统中，确定任务的最坏情况执行时间（WCET）是至关重要的。现有的方法大多依赖于静态分析或测量的方法，但这些方法在面对GPU时通常显得过于保守或复杂。

文章的创新点

为了更准确地估计GPU任务的最坏情况执行时间，这篇文章提出了一种基于“敌人程序”的方法。敌人程序的设计旨在通过故意争夺GPU资源，最大化受害者程序的干扰，从而更可靠地估计最坏情况执行时间。

方法论

设计敌人程序：敌人程序需要针对特定的干扰通道进行优化，以最大化对受害者程序的干扰。
实验驱动方法：通过实验确定不同干扰通道的有效参数，设计出能够有效干扰这些通道的敌人程序。
性能评估：通过大量实际的GPU基准程序进行评估，比较敌人程序对任务执行时间的影响。

三、必要知识与相关工作

A 背景知识

CUDA 基础

CUDA 是为 NVIDIA GPU 编写程序的 C/C++ 编程接口。执行在 GPU 上的代码称为“内核”。编写 CUDA 程序时，程序员需要指定执行内核时使用的并行 GPU 线程数量。GPU 线程被组织成块（blocks），每个块包含多个线程。在启动内核时，需要指定每个块中的线程数量以及总块数。

每个内核都关联一个 CUDA 上下文（CUDA context），该上下文包含使用 GPU 时所需的状态信息。通常，每个 CPU 进程由 CUDA 运行时创建一个这样的上下文，不同上下文的内核不会同时在 GPU 上执行。