用Python Numba库写CUDA程序(二)

CUDA的执行配置

1.一维
gpu_print[2, 4] (),其中方括号中第一个数字表示整个Grid有多少个Block,方括号中第二个数字表示一个Block有多少个Thread。
占用1个grid,2个block=2个SM,每个block的4个线程同时运行。

idx = cuda.threadIdx.x + cuda.blockIdx.x * cuda.blockDim.x 

函数gpu_print[gridDim, blockDim] (),如gpuWork[8, 128] (),启动block8*thread128个线程。
2.二维
在上一篇Mandelbrot set中,

griddim = (32,16) # 32*16=512个block
blockdim = (32, 8) # 32*8=256个thread
mandel_kernel[griddim, blockdim](-2.0, 1.0, -1.0, 1.0, d_image, 20) 
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值