对一个给定线程计算其线程束-束内索引和线程束索引的公式如下
laneID = threadIdx.x % 32
warpID = threadIdx.x / 32
有两组洗牌指令,分为整数型和浮点型,每组有4种形式的洗牌指令
1.
int __shf1(int var, int srcLane, int width=warpSize);
2.
int __shf1_up(int var, unsigned int delta, int width=warpSize);
3.
int __shf1_down(int var, unsigned int delta, int width=warpSize);
4.
int __shf1_xor(int var, int laneMask, int width=warpSize);
在本节讨论的所有洗牌函数还支持单精度浮点值。浮点洗牌函数采用浮点型的var参 数,并返回一个浮点数。否则,浮点洗牌函数就与整型洗牌函数相同了。