题目
请编程实现矩阵乘法,并考虑当矩阵规模较大时的优化方法。
思路:
按照矩阵相乘的定义进行,
根据wikipedia上的介绍:两个矩阵的乘法仅当第一个矩阵A的行数和另一个矩阵B的列数相等时才能定义。如A是m×n矩阵,B是n×p矩阵,它们的乘积AB是一个m×p矩阵,它的一个元素其中 1 ≤ i ≤ m, 1 ≤ j ≤ p。
值得一提的是,矩阵乘法满足结合律和分配率,但并不满足交换律,如下图所示的这个例子,两个矩阵交换相乘后,结果变了:
实现如下:
#include<iostream>
using namespace std;
void MulMatrix(int** matrixA, int** matrixB, int** matrixC, int m, int n, int p)
{
for(int i=0;i<m;i++)
{
for(int j=0;j<p;j++)
{
matrixC[i][j]=0;
for(int k=0;k<n;k++)
{
matrixC[i][j] += matrixA[i][k] * matrixB[k][j];
}
}
}
}
int main()
{
int **a,**b,**c;
a = new int *[2];
b = new int *[2];
c = new int *[2];
for(int i=0;i<2;i++)
{
a[i] = new int[2];
}
for(int j=0;j<3;j++)
{
b[j] = new int[3];
}
for(int k=0;k<3;k++)
{
c[k]= new int[3];
}
cout<<"Please put in the matrix A(2*2):"<<endl;
for(int i=0;i<2;i++)
for(int j=0;j<2;j++)
cin>>a[i][j];
cout<<"Please put in the matrix B(2*3):"<<endl;
for(int i=0;i<2;i++)
for(int j=0;j<3;j++)
cin>>b[i][j];
MulMatrix(a,b,c,2,2,3);
for(int i=0;i<2;i++)
{
for(int j=0;j<3;j++)
{
cout<<c[i][j]<<" ";
}
cout<<endl;
}
return 0;
}
该方法的时间复杂度是O(n^3),如果A,B是方阵的话。
利用Strassen算法可以将时间复杂度降到O(n^log7)=O(n^2.807),具体方法是定义7个变量,将矩阵分解为小矩阵进行相乘相加得到,
如下图,当给定一个两个二维矩阵A B时:
这两个矩阵A B相乘时,我们发现在相乘的过程中,有8次乘法运算,4次加法运算:
1969年,德国的一位数学家Strassen证明O(N^3)的解法并不是矩阵乘法的最优算法,他做了一系列工作使得最终的时间复杂度降低到了O(n^2.80)。
他是怎么做到的呢?还是用上文A B两个矩阵相乘的例子,他定义了7个变量:
如此,Strassen算法的流程如下:
- 两个矩阵A B相乘时,将A, B, C分成相等大小的方块矩阵:
- 可以看出C是这么得来的:
- 现在定义7个新矩阵(读者可以思考下,这7个新矩阵是如何想到的):
- 而最后的结果矩阵C 可以通过组合上述7个新矩阵得到:
表面上看,Strassen算法仅仅比通用矩阵相乘算法好一点,因为通用矩阵相乘算法时间复杂度是,而Strassen算法复杂度只是 。但随着n的变大,比如当n >> 100时,Strassen算法是比通用矩阵相乘算法变得更有效率。
如下图所示:
根据wikipedia上的介绍,后来,Coppersmith–Winograd 算法把 N* N大小的矩阵乘法的时间复杂度降低到了:,而2010年,Andrew Stothers再度把复杂度降低到了,一年后的2011年,Virginia Williams把复杂度最终定格为:。