<span style="font-family:Courier New;font-size:14px;">#include <time.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <cuda.h>
#include <cuda_runtime.h>
#include <device_launch_parameters.h>
#include <sm_12_atomic_functions.h>
/***************************
* Matrix Transpose on cpu *
**************************/
#define row 10
#define col 10
#define NUM row*col
#define K 2 // threadsPerBlock
void fillArray(int *arr)//初始化数组函数
{
int pos = 0;
for (int i=0; i<row; i++)
{
for (int j=0; j<col; j++)
{
arr[i*col + j] = pos;
pos++;
}
}
}
void printArr(int *array, int size) //打印数组元素
{
for (int i=0; i<size; i++)
{
printf("%2d ", *array++);
if ((i+1)%row == 0)
printf(&#