Q:(tangboyun)
主要是由于对__sec_reduce_xxx()这个函数的实现原理并不清楚,我把cilk的手册翻来翻去,但是好像关于这点没说的很清楚。
我知道用array notion赋值的时候,如果有data dependence的话,编译器会自己先生成一个临时变量。但是在做reduce的时候,串行语义的for循环经常被用来省去中间步骤的内存申请的,不知道__sec_reduce究竟是如何实现的。
我想问的是这么个问题:
假设 a、b都是堆上分配得到的比较大的double数组
double* a = (double*) malloc(sizeof(double)* LARGE_VALUE);
double* b = (double*) malloc(sizeof(double)* LARGE_VALUE);
.....
double sum = __sec_reduce_add( a[0:LARGE_VALUE] * b[0:LARGE_VALUE]);
如上述那样调用该函数,会造成栈溢出么?也就是 __sec_reduce_add这个函数会先计算
tmp[0:LARGE_VALUE] = a[0:LARGE_VALUE] * b[0:LARGE_VALUE];
然后再
__sec_reduce_add(tmp[0:LARGE_VALUE]) ?
还是类似串行的语义
double sum =0;
for ( int i= 0 ; i< LARGE_VALUE; ++i)
sum += a[i] * b[i];
我现在就是拿捏不准,用__sec_reduce函数的时候是不是需要手动编码把临时变量先求出来?那样需要多在堆上分配一次内存。
A:(Feilong H. (Intel))
您好,对于上面这个例子来说,__sec_reduce_add会被转化为:
double t = 0; for (int i = 0; i < LARGE_VALUE; i++) { t += a[i] * b[i]; } sum = t;
并不会使用临时数组来存放a*b的中间结果。