在做矩阵乘法并行化测试的时候,在利用<time.h>的clock()计时时出现了一点问题。
首先看串行的程序:
// matrix_cpu.c
#include <stdio.h>
#include <stdlib.h>
#include <time.h>
#define NUM 2048
void matrixMul(float *A, float *B, float *C, int M, int K, int N)
{
int i, j, k;
for(i = 0; i < M; i++)
{
for(j = 0; j < N; j++)
{
float sum = 0.0f;
for(k = 0; k < K; k++)
{
sum += A[i*k+k] * B[k*N+j];
}
C[i*N+j] = sum;
}
}
}
i