- 博客(3)
- 收藏
- 关注
原创 opencl-cts测试集中test_barrier的kernel分析
barrier(CLK_GLOBAL_MEM_FENCE)的存在可以保证上一组计算全部完成后才会进行下一次计算。lsize = 4, i = 2:temp[0] += temp[2]同时 temp[1] += temp[3]例如 a=[1,2,3,4,5,6,7,8,9,10,11,12],local size=4。则在第一个for循环时,步长为4,tmp_sum储存的为每个local group的值的和。第二个循环时,i的初始值为hadd(lsize,1) = 2。lsize = 1退出循环。
2023-04-14 15:15:41 300 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人