python cuda_Python通过pycuda使用CUDA扩展

最新推荐文章于 2024-01-24 08:34:38 发布

林宇诚

最新推荐文章于 2024-01-24 08:34:38 发布

阅读量1k

点赞数

文章标签： python cuda

本文链接：https://blog.csdn.net/weixin_42466868/article/details/111889147

版权

python对CUDA扩展有不错的支持，CUDA通过大量线程的并行化可以大幅提高代码计算速度，一般python常用numba、pycuda套件来支持CUDA扩展。numba通过JIT编译器只需将numba装饰器应用到python函数中即可实现CUDA加速，而pycuda需要基于C/C++编写kernel，其移植性、直观性更佳，这里主要介绍pycuda的使用。

1.向量加法

示例使用了1个block，block中含有400个线程，每个线程计算向量加法最终结果的一个值。

import numpy

import pycuda.autoinit

import pycuda.driver as cuda

from pycuda.compiler import SourceModule

mod = SourceModule("""

__global__ void vect_add(float *dest, float *a, float *b)

{

const int i = threadIdx.x;

dest[i] = a[i] + b[i];

}

""")

vect_add = mod.get_function("vect_add")

a = numpy.random.randn(400).astype(numpy.float32)

b = numpy.random.randn(400).astype(numpy.float32)

dest = numpy.zeros_like(a)

vect_add(cuda.Out(dest),

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

林宇诚

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python cuda_Python通过pycuda使用CUDA扩展

python对CUDA扩展有不错的支持，CUDA通过大量线程的并行化可以大幅提高代码计算速度，一般python常用numba、pycuda套件来支持CUDA扩展。numba通过JIT编译器只需将numba装饰器应用到python函数中即可实现CUDA加速，而pycuda需要基于C/C++编写kernel，其移植性、直观性更佳，这里主要介绍pycuda的使用。1.向量加法示例使用了1个block，b...
复制链接

扫一扫