加法

加法代码参考了别人的博客

#include <iostream>  
#include <stdio.h>  
//#include "kmeans.h"  
  
using namespace std;  
  
const int count = 1000;  
  
void generate_data(int *arr)  
{  
    for(int i=0;i<count;i++)   
    {  
        arr[i] = i+1;  
    }  
}  
  
int nextPowerOfTwo(int n)  
{  
    n--;  
    n = n >> 1 | n;  
    n = n >> 2 | n;  
    n = n >> 4 | n;  
    n = n >> 8 | n;  
    n = n >> 16 | n;  
    //n = n >> 32 | n; //For 64-bits int   
    return ++n;  
}  
  
/* 
cnt : count  
cnt2 : next power of two of count  
*/  
__global__ static void compute_sum(int *array,int cnt , int cnt2)  
{  
    extern __shared__ unsigned int sharedMem[];  
    sharedMem[threadIdx.x] = (threadIdx.x < cnt) ? array[threadIdx.x] : 0 ;  
    __syncthreads();  
  
    //cnt2 "must" be a power of two!  
    for( unsigned int s = cnt2/2 ; s > 0 ; s>>=1 )  
    {  
        if( threadIdx.x < s )      
        {  
            sharedMem[threadIdx.x] += sharedMem[threadIdx.x + s];  
        }  
        __syncthreads();  
    }  
    if(threadIdx.x == 0)  
    {  
        array[0] = sharedMem[0];      
    }  
}  
  
  
int main()  
{  
    int *a = new int[count];  
    generate_data(a);  
  
    int *deviceArray;  
    cudaMalloc( &deviceArray,count*sizeof(int) );  
    cudaMemcpy( deviceArray,a,count*sizeof(int),cudaMemcpyHostToDevice );  
    int npt_count = nextPowerOfTwo(count);//next power of two of count  
    //cout<<"npt_count = "<<npt_count<<endl;  
    int blockSharedDataSize = npt_count * sizeof(int);  
      
    compute_sum<<<1,count,blockSharedDataSize>>>(deviceArray,count,npt_count);
    int sum ;  
    cudaMemcpy( &sum,deviceArray,sizeof(int),cudaMemcpyDeviceToHost );  
    cout<<"sum = "<<sum<<endl;  
      
    return 0;  
}  

[1]http://blog.csdn.net/lavorange/article/details/43031419

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

andeyeluguo

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值