在执行kernel的时候(即调用clEnqueueNDRangeKernel函数的时候),有两个参数:global_work_size 和 local_work_size,分别指定NDRange中每维work-item的数量和workgroup中每维work-item的数量。
cl_int
clEnqueueNDRangeKernel(
cl_command_queue command_queue,
cl_kernel kernel,
cl_uint work_dim, // 指定新建work-item的维度(1,2,3)
const size_t *global_work_offset,
const size_t *global_work_size, // 指定NDRange中每维work-item的数量
const size_t *local_work_size, // 指定workgroup中每维work-item的数量
cl_uint num_events_in_wait_list,
const cl_event *event_wait_list,
cl_event *event);
相应地,get_global_size(idx)就是获取NDRange指定维度idx上的work-item的数量,而get_global_id(idx)就是获取当前执行的work-item在NDRange中的指定维度idx上的索引位置。另一方面,get_local_size(idx)就是获取workgroup在指定维度idx上的work-item的数量,而get_local_id(idx)就是获取当前执行的work-item在workgroup中的指定维度idx上的索引位置。