一: 安装
安装网上有教程,ps: 如果是win系统的话, 最好先安装vs, 在安装cuda
二: 入门
-
介绍
PyCuda中有一个核函数,对应Cuda中的前缀是
__global__
的核函数一般是我们程序的主要部分.还有就是thread, block, grid. https://blog.csdn.net/dcrmg/article/details/54867507
-
导入必要的库
import pycuda.driver as cuda import pycuda.autoinit from pycuda.compiler import SourceModule
-
创建一个4*4的数组, 并且转换成float类型(若显卡支持计算double类型的浮点数可不进行转换)
import numpy as np a = np.random.randn(4, 4).astype(np.float32)
-
申请a数组大小的显卡空