相信搭建完环境之后,你一定会迫不及待想要开始编程。。。
等一下,让我们先来看看官方的样例代码,先对如何编译代码有个大致了解。
1.看一个简单程序,asyncAPI(0——Simple)查看显卡型号,比较CPU与GPU性能。
只有一个.cu文件记录代码,我们先看一下.cu文件。
// includes, system
#include <stdio.h>
// includes CUDA Runtime
#include <cuda_runtime.h>
// includes, project
#include <helper_cuda.h>
#include <helper_functions.h> // helper utility functions
//前面有限定符,称之为核函数
__global__ void increment_kernel(int *g_data, int inc_value)
{
int idx = blockIdx.x * blockDim.x + threadIdx.x;
g_data[idx] = g_data[idx] + inc_value;
}
bool correct_output(int *data, const int n, const int x)
{
for (int i = 0; i < n; i++)
if (data[i] != x)
{
printf("E
等一下,让我们先来看看官方的样例代码,先对如何编译代码有个大致了解。
1.看一个简单程序,asyncAPI(0——Simple)查看显卡型号,比较CPU与GPU性能。
只有一个.cu文件记录代码,我们先看一下.cu文件。
// includes, system
#include <stdio.h>
// includes CUDA Runtime
#include <cuda_runtime.h>
// includes, project
#include <helper_cuda.h>
#include <helper_functions.h> // helper utility functions
//前面有限定符,称之为核函数
__global__ void increment_kernel(int *g_data, int inc_value)
{
int idx = blockIdx.x * blockDim.x + threadIdx.x;
g_data[idx] = g_data[idx] + inc_value;
}
bool correct_output(int *data, const int n, const int x)
{
for (int i = 0; i < n; i++)
if (data[i] != x)
{
printf("E