二维矩阵乘法,转为1维的数据,计算更快,同时计算中用r来表示A[i,k],更快
void ddot(float* A, const float*B, int n, int m, int p, float* C){
// A (2,8) B(8,2)
// n =2,m=8, p=2
// i*8 ROW_IN_LINE [ROW1 8;ROW2 8,]
float r = 1.f;
for (int i = 0; i < n; ++i){
for (int k