矩阵乘法
A、B为n x n的矩阵,计算矩阵C=A·B,使用分治法(使用将矩阵分块的策略)。
- 算法伪码:
Mult(C,A,B,n)//C=A·B
Temp matrix T[1~n,1~n]
if n=1
C[1,1] ← A[1,1]·B[1,1]
else
<partition matrices>//O(1)
spawn Mult(C11,A11,B11,n/2)
spawn Mult(C12,A11,B12,n/2)
spawn Mult(C21,A21,B11,n/2)
spawn Mult(C22,A21,B12,n/2)
spawn Mult(T11,A12,B21,n/2)
spawn Mult(T12,A12,B22,n/2)
spawn Mult(T21,A22,B21,n/2)
spawn Mult(T22,A22,B22,n/2)
sync
Add(C,T,n)
Add(C,T,n)//C=C+T
<base case of partitioning>
spawn Add(C11,T11,n/2)
spawn Add(C12,T12,n/2)
spawn Add(C21,T21,n/2)
spawn Add(C22,T22,n/2)
sync
- 算法分析:
- Ex:
- 算法缺点:
在较大规模的计算过程中,使用临时矩阵T产生的分配和回收空间上的时耗会比较大,从而降低了算法的性能。 - 改进算法思路:
可以选择放弃一些并行度以减少分配和回收空间带来的时耗。 - 改进算法伪码:
Mult-Add(C,A,B,n)//C=C+A·B
<base case of partitioning>
spawn Mult-Add (C11,A11,B11,n/2)
spawn Mult-Add (C12,A11,B12,n/2)
spawn Mult-Add (C21,A21,B11,n/2)
spawn Mult-Add (C22,A21,B12,n/2)
sync
spawn Mult-Add (C11,A12,B21,n/2)
spawn Mult-Add (C12,A12,B22,n/2)
spawn Mult-Add (C21,A22,B21,n/2)
spawn Mult-Add (C22,A22,B22,n/2)
sync
- 改进算法分析:
- Ex:
归并排序
- 算法伪码:
Merge-Sort(A,p,r)
if p<r
q ← L(p+r)/2
spawn Merge-Sort(A,p,q)
spawn Merge-Sort(A,q+1,r)
sync
Merge(A,p,q,r)//合并排序后的两部分
- 算法分析:
并行合并:
- 算法图示:
选取较长的数组A,取中间的元素,利用其在B中的位置,进行如图所示的划分,递归的处理左右两部分。 - 算法伪码:
P-Merge(A[1~l],B[1~m],C[1~n])//将A和B合并为C,n=l+m <保证l>m> <base case of merging> 使用二分查找j使得B[j]<=A[l/2]<=B[j+1] spawn P-Merge(A[1~l/2],B[1~j],C[1~l/2+j]) spawn P-Merge(A[l/2+1~l],B[j+1~m],C[l/2+j+1~n]) sync
- 算法分析:
- 算法图示: