在执行kernel的时候(即调用clEnqueueNDRangeKernel函数的时候),有两个参数:global_work_size 和 local_work_size,分别指定NDRange中每维work-item的数量和workgroup中每维work-item的数量。