/*
* Copyright 徐洪志(西北农林科技大学.信息工程学院). All rights reserved.
* Data: 2012-4-27
*/
//
// 此程序是演示了枚举enum常量如何在核函数中使用
#include <cutil_inline.h>
#include <iostream>
using namespace std;
// 枚举型常量
enum NR{NR_F, NR_S, NR_T}; // 行号
enum NC{NC_F, NC_S, NC_T, NC_E}; // 列号
/*
*param dev_data 设备上的变量
*param width 设备变量的宽度
* 用枚举常量做下标,更改设备变量的值
*/
__global__ void DataTest(int *dev_data, int width)
{
// 第一行
dev_data[NR_F*width+NC_F] = 10;
dev_data[NR_F*width+NC_S] = 11;
dev_data[NR_F*width+NC_T] = 12;
dev_data[NR_F*width+NC_E] = 13;
// 第二行
dev_data[NR_S*width+NC_F] = 11;
dev_data[NR_S*width+NC_S] = 12;
dev_data[NR_S*width+NC_T] = 13;
dev_data[NR_S*width+NC_E] = 14;
// 第三行
dev_data[NR_T*width+NC_F] = 12;
dev_data[NR_T*width+NC_S] = 13;
dev_data[NR_T*width+NC_T] = 14;
dev_data[NR_T*width+NC_E] = 15;
}
int main(int argc, char **argv)
{
CUT_DEVICE_INIT(argc, argv); // 启动CUDA
int width = 4, height = 3; // 数组的宽度和高度
int row, col;
int *host_data = (int*)calloc(width*height, sizeof(int)); // Host端数组
int *dev_data; // Device端数组
cutilSafeCall( cudaMalloc((void**)&dev_data, sizeof(int)*width*height)); // 申请全局显存空间
// 为Host端数组赋值并打印
cout << "Host Data:" << endl;
for(row = 0; row < height; ++row)
{
for(col = 0; col < width; ++col)
{
host_data[row*width+col] = row+col;
cout << host_data[row*width+col] << " ";
}
cout << endl;
}
// 将Host端数组拷贝入Device端数组
cutilSafeCall( cudaMemcpy(dev_data, host_data, sizeof(int)*width*height, cudaMemcpyHostToDevice));
// 调用核函数,更改Device端数组的数据
DataTest<<<1,1>>>(dev_data, width);
// 将Device端数组的数据拷贝入Host端数组
cutilSafeCall( cudaMemcpy(host_data, dev_data, sizeof(int)*width*height, cudaMemcpyDeviceToHost));
// 打印更改后的数据
cout << "Host Data After change:" << endl;
for(row = 0; row < height; ++row)
{
for(col = 0; col < width; ++col)
{
cout << host_data[row*width+col] << " ";
}
cout << endl;
}
// 释放内存和显存空间
free(host_data);
cutilSafeCall( cudaFree(dev_data));
CUT_EXIT(argc, argv); // 退出CUDA
}