GPGPU编程技术-从GLSL、CUDA到OpenCL 平方和算法第一版书中程序158页

最新推荐文章于 2024-01-06 11:49:09 发布

NYG8945

最新推荐文章于 2024-01-06 11:49:09 发布

阅读量807

点赞数

分类专栏： CUDA学习日记文章标签： cuda 算法编程

本文链接：https://blog.csdn.net/NYG8945/article/details/52900818

版权

CUDA学习日记专栏收录该内容

12 篇文章 2 订阅

订阅专栏

//GPGPU编程技术-从GLSL、CUDA到OpenCL  平方和算法第一版
//书中程序158页
#include <stdio.h>
#include <iostream>
#include <cuda_runtime.h> // For the CUDA runtime routines (prefixed with "cuda_")
#include <DEVICE_LAUNCH_PARAMETERS.h> //我在查询中找到的头文件 有可能有别的表达方式

#define DATA_SIZE 1048567   //4MB 的数据
using namespace std;
int anData[DATA_SIZE];

//生成随机数据量
void GenerateNumber(int *pnNumber, int nSize)
{
    for (int i = 0; i < nSize; i++)  pnNumber[i] = rand();
}

//全局函数计算平方和内核：在主机上调用，在设备上执行
__global__ static void sumofSquares(int *pnNum, int* pnResult)
{
    int nSum = 0;
    for (unsigned i = 0; i < DATA_SIZE; i++)
    {
        nSum += pnNum[i] * pnNum[i];
        *pnResult = nSum;
    }
}

void main()
{
    GenerateNumber(anData, DATA_SIZE); //生成随机数据量
    int *pnGpuData, *pnResult;
    cudaMalloc ((void**)&pnGpuData, sizeof(int) * DATA_SIZE);
    cudaMalloc ((void**)&pnResult , sizeof(int) );
    cudaMemcpy(pnGpuData, anData, sizeof(int)*DATA_SIZE, cudaMemcpyHostToDevice);

    //本版本是基础版本 在此基础上学习逐渐内存与内核并行优化
    //所以这里只用了一个内核
    sumofSquares <<< 1,1 >>> (pnGpuData, pnResult);

    int nSum = 0;
    cudaMemcpy(&nSum, pnResult, sizeof(int), cudaMemcpyDeviceToHost);
    cudaFree(pnGpuData);
    cudaFree(pnResult);
    printf("SuM = %d\n", nSum);
    system("pause");

    //return 0;

}