文章目录
参考:
【前言 什么是CPU亲和性 如何将CPU亲和性应用到程序中? thread 线程绑定CPU方法 绑定常用函数 taskset命令 参考质料】
利用Cupy獲取GPU可以計算的最大綫程數量
import cupy as cp
# 获取当前GPU设备
device = cp.cuda.Device()
# 获取每个block的最大线程数
max_threads_per_block = device.attributes['MaxThreadsPerBlock']
# 获取每个SM的最大block数
max_blocks_per_sm = device.attributes['MaxBlocksPerMultiprocessor']
# 获取GPU上的SM数量
num_sm = device.attributes['MultiProcessorCount']
# 计算GPU可以执行的最大线程数量
max_threads_on_gpu = max_threads_per_block * max_blocks_per_sm * num_sm
print("Max Threads Per Block:", max_threads_per_block)
print(