Intel C++ compiler v12的Array Notion应用中有关__sec_reduce_xxx()这个函数的实现原理

 Q:(tangboyun)

主要是由于对__sec_reduce_xxx()这个函数的实现原理并不清楚,我把cilk的手册翻来翻去,但是好像关于这点没说的很清楚。
我知道用array notion赋值的时候,如果有data dependence的话,编译器会自己先生成一个临时变量。但是在做reduce的时候,串行语义的for循环经常被用来省去中间步骤的内存申请的,不知道__sec_reduce究竟是如何实现的。

我想问的是这么个问题:

假设 a、b都是堆上分配得到的比较大的double数组
double* a = (double*) malloc(sizeof(double)* LARGE_VALUE);
double* b = (double*) malloc(sizeof(double)* LARGE_VALUE);
.....
double sum = __sec_reduce_add( a[0:LARGE_VALUE] * b[0:LARGE_VALUE]);

如上述那样调用该函数,会造成栈溢出么?也就是 __sec_reduce_add这个函数会先计算
tmp[0:LARGE_VALUE] = a[0:LARGE_VALUE] * b[0:LARGE_VALUE];
然后再
__sec_reduce_add(tmp[0:LARGE_VALUE]) ?

还是类似串行的语义
double sum =0;
for ( int i= 0 ; i< LARGE_VALUE; ++i)
    sum += a[i] * b[i];

我现在就是拿捏不准,用__sec_reduce函数的时候是不是需要手动编码把临时变量先求出来?那样需要多在堆上分配一次内存。

A:(Feilong H. (Intel))

您好,对于上面这个例子来说,__sec_reduce_add会被转化为:

并不会使用临时数组来存放a*b的中间结果。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值