算法导论 — 4.2 矩阵乘法的Strassen算法

笔记

给定两个 n × n n×n n×n正方矩阵 A A A B B B,这两个矩阵的乘法定义为
      在这里插入图片描述
  其中
      在这里插入图片描述
  下面是矩阵乘法的伪代码。
  在这里插入图片描述
  很显然,执行SQUARE-MATRIX-MULTIPLY需要花费 Θ ( n 3 ) Θ(n^3) Θ(n3)时间。然而,有一种方法可以花费更少的时间,这就是Strassen算法,它本质上也是一种分治法,它的时间复杂度为 Θ ( n l g 7 ) = O ( n 2.81 ) Θ(n^{{\rm lg}7}) = O(n^{2.81}) Θ(nlg7)=O(n2.81)
  在介绍Strassen算法之前,我们先尝试简单的分治法来计算矩阵乘法 C = A • B C = A•B C=AB。假定三个矩阵均为 n × n n×n n×n正方矩阵。并且为简化分析,假定 n n n 2 2 2的幂。我们将 A 、 B A、B AB C C C均分解为 4 4 4 ( n / 2 ) × ( n / 2 ) (n/2)×(n/2) (n/2)×(n/2)的子矩阵。
    在这里插入图片描述
  于是矩阵乘法可以表示为
    在这里插入图片描述
  上面的矩阵乘法等价于下面 4 4 4个式子。
      在这里插入图片描述
  上面每个式子都对应 2 2 2 ( n / 2 ) × ( n / 2 ) (n/2)×(n/2) (n/2)×(n/2)矩阵乘法,以及 1 1 1 ( n / 2 ) × ( n / 2 ) (n/2)×(n/2) (n/2)×(n/2)矩阵加法。根据以上分析,可以给出一个递归的分治算法。
  在这里插入图片描述
  现在分析这个简单分治法的时间复杂度。调用SQUARE-MATRIX-MULTIPLY-RECURSIVE计算两个 n × n n×n n×n矩阵乘法的运行时间用 T ( n ) T(n) T(n)表示。对于 n = 1 n = 1 n=1的初始情况,我们只需计算一次标量乘法,因此 T ( 1 ) = Θ ( 1 ) T(1) = Θ(1) T(1)=Θ(1)。当 n > 1 n > 1 n>1时,根据上面的伪代码, T ( n ) T(n) T(n)包含 8 8 8 ( n / 2 ) × ( n / 2 ) (n/2)×(n/2) (n/2)×(n/2)矩阵乘法的时间和 4 4 4 ( n / 2 ) × ( n / 2 ) (n/2)×(n/2) (n/2)×(n/2)矩阵加法的时间,所以 T ( n ) = 8 T ( n / 2 ) + Θ ( n 2 ) T(n) = 8T(n/2) + Θ(n^2) T(n)=8T(n/2)+Θ(n2),这里忽略了分解子矩阵的时间。于是,我们得到SQUARE-MATRIX-MULTIPLY-RECURSIVE的运行时间的递时式为
    在这里插入图片描述
  求解这个递归式得到 T ( n ) = Θ ( n 3 ) T(n) = Θ(n^3) T(n)=Θ(n3)。可以看到,这个简单的分治法并没有带来渐近运行时间的提升。
  下面介绍Strassen算法。Strassen算法同样要将每个矩阵分解为 4 4 4 ( n / 2 ) × ( n / 2 ) (n/2)×(n/2) (n/2)×(n/2)子矩阵。而与简单分治法不同,Strassen算法只需要递归为 7 7 7次,而不是 8 8 8次。下面直接给出Strassen算法的流程。
  (1) 将输入矩阵 A 、 B A、B AB以及输出矩阵 C C C各分解为 4 4 4 ( n / 2 ) × ( n / 2 ) (n/2)×(n/2) (n/2)×(n/2)子矩阵。
  (2) 创建 10 10 10 ( n / 2 ) × ( n / 2 ) (n/2)×(n/2) (n/2)×(n/2)矩阵 S 1 , S 2 , … , S 10 S_1, S_2, …, S_{10} S1,S2,,S10,如下所示。由于需要进行 10 10 10 ( n / 2 ) × ( n / 2 ) (n/2)×(n/2) (n/2)×(n/2)矩阵的加减法,所以这一步花费 Θ ( n 2 ) Θ(n^2) Θ(n2)时间。
    在这里插入图片描述
  (3) 用步骤(1)分解得到的子矩阵和步骤(2)中创建的 10 10 10个矩阵,递归地计算 7 7 7个矩阵乘积 P 1 , P 2 , … , P 7 P_1, P_2, …, P_7 P1,P2,,P7,如下所示。
    在这里插入图片描述
  (4) 利用矩阵 P 1 , P 2 , … , P 7 P_1, P_2, …, P_7 P1,P2,,P7进行加减运算,得到输出矩阵 C C C的子矩阵 C 11 , C 12 , C 21 , C 22 C_{11}, C_{12}, C_{21}, C_{22} C11,C12,C21,C22,如下所示。这一步需要进行 8 8 8 ( n / 2 ) × ( n / 2 ) (n/2)×(n/2) (n/2)×(n/2)矩阵的加减法,所以花费时为 Θ ( n 2 ) Θ(n^2) Θ(n2)
    在这里插入图片描述
  由于Strassen算法只需要递归为 7 7 7次,因此它的运行时间的递归式为
    在这里插入图片描述
  求解这个递归式,可以得到Strassen算法的运行时间 T ( n ) = Θ ( n l g 7 ) T(n) = Θ(n^{{\rm lg}7}) T(n)=Θ(nlg7)

练习

4.2-1 使用Strassen算法计算如下矩阵乘法:
    在这里插入图片描述
  给出计算过程。
  
  (1) 分解输入矩阵
    在这里插入图片描述
  (2) 计算矩阵 S 1 , S 2 , … , S 10 S_1, S_2, …, S_{10} S1,S2,,S10
    在这里插入图片描述
  (3) 计算矩阵 P 1 , P 2 , … , P 7 P_1, P_2, …, P_7 P1,P2,,P7
    在这里插入图片描述
  (4) 计算输出矩阵的 4 4 4个子矩阵
    在这里插入图片描述
  最终结果为
    在这里插入图片描述
  
4.2-2 为Strassen算法编写伪代码。
  
  这里还是假设了矩阵的宽高 n n n 2 2 2的幂。下面给出伪代码。
  在这里插入图片描述
  
4.2-3 如何修改Strassen算法,使之适应矩阵规模 n n n不是 2 2 2的幂的情况?证明:算法的运行时间为 Θ ( n l g 7 ) Θ(n_{{\rm lg}7}) Θ(nlg7)
  
  为了保证算法的通用性,需要考虑矩阵的宽高 n n n不为 2 2 2的幂的情况。分两种情况讨论。
  (1) n n n为偶数
  这种情况下 n × n n×n n×n矩阵可以直接分解为 4 4 4 ( n / 2 ) × ( n / 2 ) (n/2)×(n/2) (n/2)×(n/2)的子矩阵,因此可以直接应用Strassen算法。为了计算矩阵乘法 C n × n = A n × n • B n × n C_{n×n} = A_{n×n}•B_{n×n} Cn×n=An×nBn×n,令 m = n / 2 m = n/2 m=n/2,需要将矩阵分解为
    在这里插入图片描述
  这种情况下,矩阵乘法所花费的时间 T ( n ) = 7 T ( n / 2 ) + Θ ( n 2 ) T(n) = 7T(n/2) + Θ(n^2) T(n)=7T(n/2)+Θ(n2)
  (2) n n n为奇数
  这种情况不能直接应用Strassen算法。为了计算矩阵乘法 C n × n = A n × n • B n × n C_{n×n} = A_{n×n}•B_{n×n} Cn×n=An×nBn×n,令 m = n − 1 m = n−1 m=n1,将矩阵做如下分解
    在这里插入图片描述
  如上所示,每个 n × n n×n n×n矩阵被分解为一个 ( n − 1 ) × ( n − 1 ) (n−1)×(n−1) (n1)×(n1)矩阵、一个 ( n − 1 ) × 1 (n−1)×1 (n1)×1矩阵、一个 1 × ( n − 1 ) 1×(n−1) 1×(n1)矩阵和一个 1 × 1 1×1 1×1矩阵。相应地,矩阵乘法 C n × n = A n × n • B n × n C_{n×n} = A_{n×n}•B_{n×n} Cn×n=An×nBn×n可以分解为下面 4 4 4个式子。
    在这里插入图片描述
  上面4个式子包含了8个不同规模的矩阵乘法,下面逐个进行分析。
  1) A 1 1 m × m • B 1 1 m × m A11_{m×m}•B11_{m×m} A11m×mB11m×m:由于 m = n − 1 m = n−1 m=n1是偶数,所以这个矩阵乘法可以直接应用Strassen算法。
  这一矩阵乘法所花费的时间为 T ( n − 1 ) = 7 T ( ( n − 1 ) / 2 ) + Θ ( ( n − 1 ) 2 ) = 7 T ( ⌊ n / 2 ⌋ ) + Θ ( n 2 ) T(n-1)=7T((n-1)/2)+Θ((n-1)^2)=7T(⌊n/2⌋)+Θ(n^2) T(n1)=7T((n1)/2)+Θ((n1)2)=7T(n/2)+Θ(n2)
  2) A 1 2 m × 1 • B 2 1 1 × m A12_{m×1}•B21_{1×m} A12m×1B211×m:采用朴素算法,需要做 ( n − 1 ) 2 (n−1)^2 (n1)2次乘法,因此运行时间为 Θ ( n 2 ) Θ(n^2) Θ(n2)
  3) A 1 1 m × m • B 1 2 m × 1 A11_{m×m}•B12_{m×1} A11m×mB12m×1:采用朴素算法,需要做 ( n − 1 ) 2 (n−1)^2 (n1)2次乘法和 ( n − 1 ) ( n − 2 ) (n−1)(n−2) (n1)(n2)次加法,因此运行时间也为 Θ ( n 2 ) Θ(n^2) Θ(n2)
  4) A 1 2 m × 1 • B 2 2 1 × 1 A12_{m×1}•B22_{1×1} A12m×1B221×1:采用朴素算法,需要做 ( n − 1 ) (n−1) (n1)次乘法,运行时间为 Θ ( n ) Θ(n) Θ(n)
  5) A 2 1 1 × m • B 1 1 m × m A21_{1×m}•B11_{m×m} A211×mB11m×m:采用朴素算法,需要做 ( n − 1 ) 2 (n−1)^2 (n1)2次乘法,以及 ( n − 1 ) ( n − 2 ) (n−1)(n−2) (n1)(n2)次加法,运行时间为 Θ ( n 2 ) Θ(n^2) Θ(n2)
  6) A 2 2 1 × 1 • B 2 1 1 × m A22_{1×1}•B21_{1×m} A221×1B211×m:采用朴素算法,需要做 ( n − 1 ) (n−1) (n1)次乘法,运行时间为 Θ ( n ) Θ(n) Θ(n)
  7) A 2 1 1 × m • B 1 2 m × 1 A21_{1×m}•B12_{m×1} A211×mB12m×1:采用朴素算法,需要做 ( n − 1 ) (n−1) (n1)次乘法,以及 ( n − 2 ) (n−2) (n2)次加法,运行时间为 Θ ( n ) Θ(n) Θ(n)
  8) A 2 2 1 × 1 • B 2 2 1 × 1 A22_{1×1}•B22_{1×1} A221×1B221×1:这仅仅是两个元素的相乘,只花费 Θ ( 1 ) Θ(1) Θ(1)时间。
  根据以上分析,除去 A 1 1 m × m • B 1 1 m × m A11_{m×m}•B11_{m×m} A11m×mB11m×m之外,其他 7 7 7个矩阵乘法加起来的运行时间为 Θ ( n 2 ) Θ(n^2) Θ(n2)。因此,当 n n n为奇数时, n × n n×n n×n矩阵乘法的运行时间为
     T ( n ) = 7 T ( ⌊ n / 2 ⌋ ) + Θ ( n 2 ) T(n)=7T(⌊n/2⌋)+Θ(n^2) T(n)=7T(n/2)+Θ(n2)
  综合以上两种情况,无论 n n n为奇数还是偶数,矩阵乘法的运行时间都为 T ( n ) = 7 T ( ⌊ n / 2 ⌋ ) + Θ ( n 2 ) T(n)=7T(⌊n/2⌋)+Θ(n^2) T(n)=7T(n/2)+Θ(n2)。忽略其中的⌊ ⌋符号,这与之前分析的Strassen算法的运行时间是一样的。
  下面给出具备通用性的Strassen算法的伪代码。
  在这里插入图片描述
  在这里插入图片描述
  
4.2-4 如果可以用 k k k次乘法操作(假定乘法的交换律不成立)完成两个 3 × 3 3×3 3×3矩阵相乘,那么你可以在 o ( n l g 7 ) o(n^{{\rm lg}7}) o(nlg7)时间内完成 n × n n×n n×n矩阵相乘,满足这一条件的最大 k k k是多少?此算法的运行时间是怎样的?
  
  仍然采用Strassen算法。我们现在分析该算法运行时间的递归式,不过在这里需要以 T ( 3 ) T(3) T(3)作为边界条件,递归式如下所示。
    在这里插入图片描述
  如果我们画出递归树,该递归树一共有 l g ( n / 3 ) lg(n/3) lg(n/3)层。叶结点对应子问题 T ( 3 ) T(3) T(3)。由于每层的结点数是上一层的 7 7 7倍,因此第 i i i层包含 7 i 7^i 7i个结点。因此,叶结点一共有 7 l g ( n / 3 ) = 7 l g n − l g 3 = 7 l g n / 7 l g 3 = n l g 7 / 7 l g 3 7^{{\rm lg}(n/3)} =7^{{\rm lg}n-{\rm lg}3}=7^{{\rm lg}n}/7^{{\rm lg}3} =n^{{\rm lg}7}/7^{{\rm lg}3} 7lg(n/3)=7lgnlg3=7lgn/7lg3=nlg7/7lg3个。因此所有叶结点的代价之和为 ( n l g 7 / 7 l g 3 ) • T ( 3 ) = k • ( n l g 7 / 7 l g 3 ) (n^{{\rm lg}7}/7^{{\rm lg}3})•T(3)=k•(n^{{\rm lg}7}/7^{{\rm lg}3}) (nlg7/7lg3)T(3)=k(nlg7/7lg3)
  如果要在 o ( n l g 7 ) o(n_{{\rm lg}7}) o(nlg7)时间内完成 n × n n×n n×n矩阵相乘,那么必然有 k • ( n l g 7 / 7 l g 3 ) < n l g 7 k•(n^{{\rm lg}7}/7^{{\rm lg}3})<n^{{\rm lg}7} k(nlg7/7lg3)<nlg7,于是得到 k < 7 l g 3 ≈ 21.85 k<7^{{\rm lg}3}≈21.85 k<7lg321.85。所以 k k k的最大值为 21 21 21
  
4.2-5 V.Pan发现一种方法,可以用 132464 132 464 132464次乘法操作完成 68 × 68 68×68 68×68的矩阵相乘,发现另一种方法,可以用 143640 143 640 143640次乘法操作完成 70 × 70 70×70 70×70的矩阵相乘,还发现一种方法,可以用 155424 155 424 155424次乘法操作完成 72 × 72 72×72 72×72的矩阵相乘。当用于矩阵相乘的分治算法时,上述哪种方法会得到最佳的渐近运行时间?与Strassen算法相比,性能如何?
  
  对于采用分治法的矩阵乘法算法来说,其运行时间都为 Θ ( n d ) Θ(n^d) Θ(nd),其中 d d d为一个正常数。现在分析题目所给的 3 3 3种方法,其渐近运行时间中的 d d d分别为多少。为方便起见,假设 3 3 3种方法的运行时间分别为 T 1 ( n ) = n d 1 , T 2 ( n ) = n d 2 T_1(n)=n^{d_1},T_2(n)=n^{d_2} T1(n)=nd1T2(n)=nd2 T 3 ( n ) = n d 3 T_3(n)=n^{d_3} T3(n)=nd3
  用 132464 132 464 132464次乘法操作完成 68 × 68 68×68 68×68的矩阵相乘,于是有
     T 1 ( 68 ) = 6 8 d 1 = 132464 T_1 (68)=68^{d_1}=132464 T1(68)=68d1=132464
  得到 d 1 = l o g 68 132464 ≈ 2.795128 d_1={\rm log}_{68}132464≈2.795128 d1=log681324642.795128
  用 143640 143 640 143640次乘法操作完成 70 × 70 70×70 70×70的矩阵相乘,于是有
     T 2 ( 70 ) = 7 0 d 2 = 143640 T_2 (70)=70^{d_2}=143640 T2(70)=70d2=143640
  得到 d 2 = l o g 70 143640 ≈ 2.795122 d_2={\rm log}_{70}143640≈2.795122 d2=log701436402.795122
  用 155424 155 424 155424次乘法操作完成 72 × 72 72×72 72×72的矩阵相乘,于是有
     T 3 ( 72 ) = 7 2 d 3 = 155424 T_3 (72)=72^{d_3}=155424 T3(72)=72d3=155424
  得到 d 3 = l o g 72 155424 ≈ 2.795147 d_3={\rm log}_{72}155424≈2.795147 d3=log721554242.795147
  根据以上分析,第(2)种方法的渐近运行时间的指数 d 2 d_2 d2是最小的,所以第(2)种方法会得到最佳的渐近运行时间。
  Strassen算法的渐近运行时间为 Θ ( n l g 7 ) Θ(nlg7) Θ(nlg7) l g 7 ≈ 2.807355 > d 2 {\rm lg}7 ≈ 2.807355 > d_2 lg72.807355>d2,因此上述第(2)种方法的性能是优于Strassen算法的。
  
4.2-6 用Strassen算法作为子过程来进行一个 k n × n kn×n kn×n矩阵和一个 n × k n n×kn n×kn矩阵相乘,最快需要花费多长时间?对两个输入矩阵规模互换的情况,回答相同的问题。
  
  两个矩阵 A k n × n A_{kn×n} Akn×n B n × k n B_{n×kn} Bn×kn相乘,得到矩阵 C k n × k n C_{kn×kn} Ckn×kn。如果要利用Strassen算法,则需要将矩阵 A 、 B A、B AB C C C按下面的方式分解
    在这里插入图片描述
  矩阵 C C C的任意一个子矩阵 C i j = A i • B j C_{ij} = A_i • B_j Cij=AiBj, 这是一个 n × n n×n n×n矩阵乘法,采用Strassen算法,运行时间为 Θ ( n l g 7 ) Θ(n^{{\rm lg}7}) Θ(nlg7)。一共有 k 2 k^2 k2个这样的 n × n n×n n×n矩阵乘法,所以总的运行时间为 Θ ( k 2 • n l g 7 ) Θ(k^2•n^{{\rm lg}7}) Θ(k2nlg7)
  如果将输入矩阵的规模互换,即矩阵 A n × k n A_{n×kn} An×kn B k n × n B_{kn×n} Bkn×n相乘,得到矩阵 C n × n Cn×n Cn×n,那么需要将矩阵 A A A B B B按下面的方式分解
    在这里插入图片描述
  矩阵 C = A 1 • B 1 + A 2 • B 2 + … + A k • B k C = A1 • B1 + A2 • B2 + … + Ak • Bk C=A1B1+A2B2++AkBk。一共有 k k k n × n n×n n×n矩阵乘法,并且还有 ( k − 1 ) (k−1) (k1) n × n n×n n×n矩阵加法,所以总的运行时间为 Θ ( k • n l g 7 ) Θ(k•n^{{\rm lg}7}) Θ(knlg7)
  
4.2-7 设计算法,仅使用三次实数乘法即可完成复数 a + b i a+bi a+bi c + d i c+di c+di相乘。算法需接收 a 、 b 、 c a、b、c abc d d d为输入,分别生成实部 a c − b d ac−bd acbd和虚部 a d + b c ad+bc ad+bc
  
  借鉴Strassen算法的思想,该问题可以按以下步骤解决。
  (1) 计算 P 1 、 P 2 P_1、P_2 P1P2 P 3 P_3 P3
     P 1 = a d P_1 = ad P1=ad
     P 2 = b c P_2 = bc P2=bc
     P 3 = ( a – b ) ( c + d ) = a c – b d + a d – b c P_3 = (a – b)(c + d) = ac – bd + ad – bc P3=(ab)(c+d)=acbd+adbc
  (2) 计算实部和虚部
    实部: P 3 – P 1 + P 2 = a c − b d P_3 – P_1 + P_2 = ac−bd P3P1+P2=acbd
    虚部: P 1 + P 2 = a d + b c P_1 + P_2 = ad+bc P1+P2=ad+bc
  该算法只需要 3 3 3次乘法即可。
  
  本节代码链接:
  https://github.com/yangtzhou2012/Introduction_to_Algorithms_3rd/tree/master/Chapter04/Section_4.2

  • 14
    点赞
  • 87
    收藏
    觉得还不错? 一键收藏
  • 5
    评论
### 回答1: Strassen矩阵乘法算法是一种用于计算两个矩阵乘积的高效方法,其基本思想是将原始矩阵划分为较小的子矩阵,并通过递归调用来计算乘积。下面是使用C语言实现Strassen矩阵乘法算法的一个示例: ```c #include<stdio.h> void strassen(int n, int A[][n], int B[][n], int C[][n]) { if (n == 1) { C[0][0] = A[0][0] * B[0][0]; return; } // 计算矩阵的中间大小 int half = n / 2; // 划分原始矩阵为四个子矩阵 int A11[half][half], A12[half][half], A21[half][half], A22[half][half]; int B11[half][half], B12[half][half], B21[half][half], B22[half][half]; int C11[half][half], C12[half][half], C21[half][half], C22[half][half]; int P[half][half], Q[half][half], R[half][half], S[half][half], T[half][half], U[half][half], V[half][half]; // 初始化子矩阵 for (int i = 0; i < half; i++) { for (int j = 0; j < half; j++) { A11[i][j] = A[i][j]; A12[i][j] = A[i][j + half]; A21[i][j] = A[i + half][j]; A22[i][j] = A[i + half][j + half]; B11[i][j] = B[i][j]; B12[i][j] = B[i][j + half]; B21[i][j] = B[i + half][j]; B22[i][j] = B[i + half][j + half]; } } // 递归调用计算子矩阵 strassen(half, A11, B11, P); strassen(half, A12, B21, Q); strassen(half, A11, B12, R); strassen(half, A12, B22, S); strassen(half, A21, B11, T); strassen(half, A22, B21, U); strassen(half, A21, B12, V); // 计算结果矩阵的子矩阵 for (int i = 0; i < half; i++) { for (int j = 0; j < half; j++) { C11[i][j] = P[i][j] + Q[i][j]; C12[i][j] = R[i][j] + S[i][j]; C21[i][j] = T[i][j] + U[i][j]; C22[i][j] = R[i][j] + T[i][j] + U[i][j] + V[i][j]; } } // 将子矩阵组合为结果矩阵 for (int i = 0; i < half; i++) { for (int j = 0; j < half; j++) { C[i][j] = C11[i][j]; C[i][j + half] = C12[i][j]; C[i + half][j] = C21[i][j]; C[i + half][j + half] = C22[i][j]; } } } int main() { int n; printf("请输入矩阵维度n:"); scanf("%d", &n); int A[n][n], B[n][n], C[n][n]; printf("请输入矩阵A:\n"); for (int i = 0; i < n; i++) { for (int j = 0; j < n; j++) { scanf("%d", &A[i][j]); } } printf("请输入矩阵B:\n"); for (int i = 0; i < n; i++) { for (int j = 0; j < n; j++) { scanf("%d", &B[i][j]); } } strassen(n, A, B, C); printf("结果矩阵C:\n"); for (int i = 0; i < n; i++) { for (int j = 0; j < n; j++) { printf("%d ", C[i][j]); } printf("\n"); } return 0; } ``` 这个示例代码实现了一个递归的Strassen矩阵乘法算法。用户需要在运行代码时输入矩阵的维度n,以及矩阵A和B的元素。程序将计算A和B的乘积,并打印结果矩阵C。 ### 回答2: Strassen矩阵乘法算法是一种用于快速计算矩阵乘法算法,采用分治策略,并且在一些情况下具有比传统算法更高的效率。下面是一个使用C语言实现Strassen矩阵乘法算法的例子: ```c #include <stdio.h> #include <stdlib.h> void strassen(int n, int A[][n], int B[][n], int C[][n]) { if (n == 2) { // 基本情况,直接使用传统算法计算 int P = (A[0][0] + A[1][1]) * (B[0][0] + B[1][1]); int Q = (A[1][0] + A[1][1]) * B[0][0]; int R = A[0][0] * (B[0][1] - B[1][1]); int S = A[1][1] * (B[1][0] - B[0][0]); int T = (A[0][0] + A[0][1]) * B[1][1]; int U = (A[1][0] - A[0][0]) * (B[0][0] + B[0][1]); int V = (A[0][1] - A[1][1]) * (B[1][0] + B[1][1]); C[0][0] = P + S - T + V; C[0][1] = R + T; C[1][0] = Q + S; C[1][1] = P + R - Q + U; } else { int newSize = n/2; int A11[newSize][newSize], A12[newSize][newSize], A21[newSize][newSize], A22[newSize][newSize]; int B11[newSize][newSize], B12[newSize][newSize], B21[newSize][newSize], B22[newSize][newSize]; int C11[newSize][newSize], C12[newSize][newSize], C21[newSize][newSize], C22[newSize][newSize]; int P1[newSize][newSize], P2[newSize][newSize], P3[newSize][newSize], P4[newSize][newSize], P5[newSize][newSize], P6[newSize][newSize], P7[newSize][newSize]; int i, j; for (i = 0; i < newSize; i++) { for (j = 0; j < newSize; j++) { A11[i][j] = A[i][j]; A12[i][j] = A[i][j + newSize]; A21[i][j] = A[i + newSize][j]; A22[i][j] = A[i + newSize][j + newSize]; B11[i][j] = B[i][j]; B12[i][j] = B[i][j + newSize]; B21[i][j] = B[i + newSize][j]; B22[i][j] = B[i + newSize][j + newSize]; } } strassen(newSize, A11, B11, P1); strassen(newSize, A12, B21, P2); strassen(newSize, A11, B12, P3); strassen(newSize, A12, B22, P4); strassen(newSize, A21, B11, P5); strassen(newSize, A22, B21, P6); strassen(newSize, A21, B12, P7); for (i = 0; i < newSize; i++) { for (j = 0; j < newSize; j++) { C11[i][j] = P1[i][j] + P4[i][j] - P5[i][j] + P7[i][j]; C12[i][j] = P3[i][j] + P5[i][j]; C21[i][j] = P2[i][j] + P4[i][j]; C22[i][j] = P1[i][j] + P3[i][j] - P2[i][j] + P6[i][j]; C[i][j] = C11[i][j]; C[i][j + newSize] = C12[i][j]; C[i + newSize][j] = C21[i][j]; C[i + newSize][j + newSize] = C22[i][j]; } } } } int main() { int n = 4; // 矩阵维数 int A[][4] = {{1, 2, 3, 4}, {5, 6, 7, 8}, {9, 10, 11, 12}, {13, 14, 15, 16}}; int B[][4] = {{17, 18, 19, 20}, {21, 22, 23, 24}, {25, 26, 27, 28}, {29, 30, 31, 32}}; int C[4][4]; strassen(n, A, B, C); int i, j; for (i = 0; i < n; i++) { for (j = 0; j < n; j++) { printf("%d ", C[i][j]); } printf("\n"); } return 0; } ``` 以上是一个简单的C语言实现的Strassen矩阵乘法算法。在此例子中,我们使用了一个4x4的矩阵作为输入,并打印出计算结果。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值