cuda中矩阵相加编程

#include<stdio.h>
#include<stdlib.h>
#include<unistd.h>
 




 __global__ void VecAdd(float*A, float*B, float*C, int N)
 {
       int i = blockDim.x * blockIdx.x + threadIdx.x;
       
       if ( i < N)
       C[i] = A[i] + B[i];
     
 }


int main()

 
      int N = 100;
      int i = 0 ;
      
      size_t size = N*sizeof(float);
      
      //Allocate input vectors h_A and h_B in host memory
      float * h_A = (float*)malloc(size);
      float * h_B = (float*)malloc(size);
      float * h_C = (float*)malloc(size);
      
      // Initialize input vectors
      for (i = 0; i < N; i++)
      {
              h_A[i] = 1.0;
              h_B[i] = 2.0;
              h_C[i] = 0.0;
              
      
      }
      
      
      //Allocate vectors in device memory
      
      float*d_A;
      cudaMalloc( (void **)&d_A,size);
      float*d_B;
      cudaMalloc( (void **)&d_B,size);
      float*d_C;
      cudaMalloc( (void **)&d_C,size);
      
      
      //Copy vectors from host memory to device memory
      cudaMemcpy(d_A, h_A, size, cudaMemcpyHostToDevice);
      
      cudaMemcpy(d_B, h_B, size, cudaMemcpyHostToDevice);
      
      //Invoke kernel
      
      int threadsPerBlock = 256;
      int blockPerGrid = (N + threadsPerBlock - 1)/ threadsPerBlock;
      
      VecAdd<<<blockPerGrid,threadsPerBlock>>>(d_A,d_B,d_C,N);
      
  
      // Copy result from device memory to host memory
      // h_C contains the result in host memory
      
      cudaMemcpy(h_C,d_C,size,cudaMemcpyDeviceToHost);
      
      for(i = 0; i < N; i++)
      {
          printf("%f",h_C[i]);
      }
      
      cudaFree(d_A);
      cudaFree(d_B);
      cudaFree(d_C);
      
      
      free(h_A);
      free(h_B);
      free(h_C);
      
}













































  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值