GPU 并行编程- Inclusive Scan 全面扫描算法

定义

扫描操作采用二进制关联运算符 ⨁ \bigoplus (circle plus)和一个有n个元素的数组组成。
数组为
[ x 0 , x 1 , . . . . . . , x n − 1 ] [x_0,x_1,......,x_{n-1} ] [x0,x1,......,xn1]
返回值为
[ x 0 , ( x 0 ⨁ x 1 ) , . . . . . . , ( x 0 ⨁ x 1 ⨁ . . . . ⨁ x n − 1 ) ] [x_0,(x_0 \bigoplus x_1 ),......,(x_0\bigoplus x_1\bigoplus ....\bigoplus x_{n-1} ) ] [x0,(x0x1),......,(x0x1....xn1)]
例子:
如果 ⨁ \bigoplus 代表加法,那么扫描操作
输入数组
A[]=[3 1 7 0 4 1 6 3],
返回值为
B[]=[3 4 11 11 15 16 22 25]

实例

问题

假设有一个 100 米长的三明治需要喂给10个人,
假设我们知道每个人需要的长度为:
A=[3 5 2 7 28 4 3 0 8 1]
问题1:我们如何快速分割三明治?
问题2:三明治会剩下多少?

解决方法

方法1

按顺序分割:第一次切3米,第二次切5米,第三次切2米…依此类推。

方法2

计算前缀和(prefix sum)
[3, 8, 10, 17, 45, 49,52,52,60,61] (剩下39)
在3米,8米,10米。。。。的位置分割就会得到每一段的长度

Scan的典型应用

  • Scan是一个简单并且有用的并行构筑模块

    • Convert recurrences from sequential:
      for(int i=1;i<n;i++)
      	output[i]=output
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值