linux tty多进程用,理解多CUDA Context(多进程同时使用GPU)的情况

最新推荐文章于 2023-02-16 15:39:19 发布

陈大一

最新推荐文章于 2023-02-16 15:39:19 发布

阅读量1.2k

点赞数

文章标签： linux tty多进程用

本文探讨了在Linux环境下，CUDA多进程使用GPU时遇到的问题，特别是在Maxwell架构下，由于计算抢占机制的不同导致的问题。内容涉及到CUDA Context、GPU计算抢占技术的演变，以及多进程间的交互。CUDA 3.2之后，同一进程内的多个线程共享一个Context，而在Pascal架构引入硬件计算抢占，使得多进程能在GPU上更好地并行执行。

摘要由CSDN通过智能技术生成

起源于前段时间做的一个GPU实验，关于两个CUDA进程的进程间通信(用CUDA-IPC机制，一个进程在显存中写，另一个进程一边自旋锁一边读数据是否被更改)。实验过程中发现(环境为Ubuntu16/18)，在Pascal架构的电脑上做的时候，实验是成功的。然而转到Maxwell架构的电脑上做，发现CUDA程序自旋锁会导致桌面卡住，即使放弃桌面转到tty控制台中做依然失败，因为B进程自旋锁的时候会导致A进程卡主*，根本写不进去。

一开始认为原因是在Pascal架构之前，没有MPS技术，多个cuda进程无法同时在GPU中执行。但事实上软件支持的MPS对硬件计算能力要求不高(>=3.5)，cuda>=5.5就可以。且MPS一般默认关闭，在Pascal架构上实验时也并没有开启MPS。

后来发现原因是Pascal架构开始支持计算抢占。

相关技术及对应的架构：

Compute Preemption 计算抢占 :

available since cc6(pascal)

具体抢占策略未公开

假依赖-------->HyperQ-------->软件实现MPS------->硬件实现MPS

Fermi(cc2)---Kapler(cc3)----cc>=3.5∩cuda>=5.5----Volta(cc7)

CUDA Context

GPU的Context可类比于CPU的进程；

上下文主要由以下资源组成：

·程序计数器；·寄存器；·共享内存

——CUDA C权威编程指南

Contex中囊括了Stream

——高性能CUDA应用设计与

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
linux tty多进程用,理解多CUDA Context(多进程同时使用GPU)的情况

起源于前段时间做的一个GPU实验，关于两个CUDA进程的进程间通信(用CUDA-IPC机制，一个进程在显存中写，另一个进程一边自旋锁一边读数据是否被更改)。实验过程中发现(环境为Ubuntu16/18)，在Pascal架构的电脑上做的时候，实验是成功的。然而转到Maxwell架构的电脑上做，发现CUDA程序自旋锁会导致桌面卡住，即使放弃桌面转到tty控制台中做依然失败，因为B进程自旋锁的时候会导致...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。