不同编程环境中GPU调用代码

司南锤

于 2024-07-09 18:39:05 发布

阅读量331

点赞数 2

分类专栏： cs基础 LLM 文章标签： python

本文链接：https://blog.csdn.net/qq_52964132/article/details/140303866

版权

cs基础同时被 2 个专栏收录

30 篇文章 0 订阅

订阅专栏

LLM

2 篇文章 0 订阅

订阅专栏

在编程中，调用 集成显卡（集显） 和 独立显卡（独显） 通常涉及设置GPU设备和执行计算任务。以下是一些示例代码，展示了如何在不同编程环境中使用 集显 和 独显 。

文章目录

1. 使用CUDA和PyTorch调用GPU

检查可用的GPU设备

首先，检查系统中可用的GPU设备：

import torch

# 检查可用的GPU设备
if torch.cuda.is_available():
    print(f"Available GPUs: {torch.cuda.device_count()}")
    for i in range(torch.cuda.device_count()):
        print(f"GPU {i}: {torch.cuda.get_device_name(i)}")
else:
    print("No GPU available, using CPU.")

设置默认GPU设备

设置默认的GPU设备，以便在代码中使用：

# 设置默认的GPU设备
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print(f"Using device: {device}")

将模型和数据移动到GPU

将模型和数据移动到指定的GPU设备上：

# 定义一个简单的模型
model = torch.nn.Linear(10, 1)
model.to(device)

# 定义输入数据
input_data = torch.randn(16, 10).to(device)

# 执行前向传播
output = model(input_data)
print(output)

2. 使用TensorFlow调用GPU

检查可用的GPU设备

检查系统中可用的GPU设备：

import tensorflow as tf

# 检查可用的GPU设备
gpus = tf.config.experimental.list_physical_devices('GPU')
if gpus:
    for gpu in gpus:
        print(f"Available GPU: {gpu}")
else:
    print("No GPU available, using CPU.")

设置GPU内存增长

为了避免GPU内存分配问题，可以设置GPU内存增长：

# 设置GPU内存增长
for gpu in gpus:
    tf.config.experimental.set_memory_growth(gpu, True)

将模型和数据移动到GPU

将模型和数据移动到指定的GPU设备上：

# 定义一个简单的模型
model = tf.keras.Sequential([
    tf.keras.layers.Dense(1, input_shape=(10,))
])

# 定义输入数据
input_data = tf.random.normal([16, 10])

# 执行前向传播
with tf.device('/GPU:0'):  # 指定使用第一个GPU设备
    output = model(input_data)
    print(output)

3. 使用Numba调用GPU

Numba是一个用于Python的JIT编译器，可以加速数值计算。以下是一个使用Numba调用GPU的示例：

from numba import cuda
import numpy as np

# 检查可用的GPU设备
device = cuda.get_current_device()
print(f"Using GPU: {device.name}")

# 定义一个简单的GPU函数
@cuda.jit
def add_kernel(a, b, c):
    i = cuda.grid(1)
    if i < c.size:
        c[i] = a[i] + b[i]

# 准备输入数据
a = np.array([1, 2, 3, 4], dtype=np.float32)
b = np.array([5, 6, 7, 8], dtype=np.float32)
c = np.zeros_like(a)

# 将数据移动到GPU
d_a = cuda.to_device(a)
d_b = cuda.to_device(b)
d_c = cuda.to_device(c)

# 执行GPU计算
threads_per_block = 32
blocks_per_grid = (a.size + threads_per_block - 1) // threads_per_block
add_kernel[blocks_per_grid, threads_per_block](d_a, d_b, d_c)

# 将结果从GPU移动回CPU
c = d_c.copy_to_host()
print(c)