【算法导论】4.2

最新推荐文章于 2022-04-15 15:53:25 发布

mahaoyuan2015

最新推荐文章于 2022-04-15 15:53:25 发布

阅读量248

点赞数

分类专栏：读书笔记文章标签：算法导论分治矩阵相乘 Strassen

本文链接：https://blog.csdn.net/mahaoyuan2015/article/details/83758835

版权

读书笔记专栏收录该内容

12 篇文章 0 订阅

订阅专栏

矩阵乘法的 Strassen 算法

朴素算法时间复杂度: $Θ(n^3)$ ；

一般分治算法：
$A=\left[ \begin{matrix} A_{11} & A_{12} \\ A_{21} & A_{22} \end{matrix} \right] ~~B=\left[ \begin{matrix} B_{11} & B_{12} \\ B_{21} & B_{22} \end{matrix} \right] ~~ C=\left[ \begin{matrix} C_{11} & C_{12} \\ C_{21} & C_{22} \end{matrix} \right] \tag{1}$
其中四个子矩阵的规模为 $n / 2$ 则：
$\left[ \begin{matrix} C_{11} & C_{12} \\ C_{21} & C_{22} \end{matrix} \right] =\left[ \begin{matrix} A_{11} & A_{12} \\ A_{21} & A_{22} \end{matrix} \right] .\left[ \begin{matrix} B_{11} & B_{12} \\ B_{21} & B_{22} \end{matrix} \right]$
如此递归求解，则：
$T(n)=\left\{ \begin{matrix} Θ(1) ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~n=1\\ 8T(n/2)+Θ(n^2)~~~~~~~~~~~n>1 \end{matrix} \right.$
解得 $T(n)=Θ(n^3)$

Strassen算法：

仍按 $(1)$ 式将矩阵分解。
按一定公式计算 $S_1,S_2...S_{10}$ (仅包含加减运算)。
按一定公式递归的计算7个矩阵积 $P_1,P_2...P_7$ ；每个矩阵规模都是 $n / 2$ 。
通过 $P_i$ 矩阵的不同组合进行加减运算，得出 $C_{11},C_{12},C_{21},C_{22}$ 。
合并 $C_{11},C_{12},C_{21},C_{22}$ 得出 $C$ 。

得到此法递归式：
$T(n)=\left\{ \begin{matrix} Θ(1) ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~n=1\\ 7T(n/2)+Θ(n^2)~~~~~~~~~~~n>1 \end{matrix} \right.$
解得 $T(n)=Θ(n^{lg_7})$

代码如下：

#define _CRT_SECURE_NO_WARNINGS
#include<stdio.h>
#define N 20
/*矩阵加法，f==1 表示加，f==2 表示减*/
void ad(int n, int a[N][N], int b[N][N], int c[N][N], int f)
{
	int i, j;
	for (i = 1; i <= n; i++)
		for (j = 1; j <= n; j++)
			if (f == 1)
				c[i][j] = a[i][j] + b[i][j];
			else
				c[i][j] = a[i][j] - b[i][j];
	return;
}
/*递归函数*/
void cal(int n, int A[N][N], int B[N][N], int C[N][N])
{
	/*递归出口*/
	if (n == 1) 
	{
		C[1][1] = A[1][1] * B[1][1];
		return;
	}
	int a[6][N][N], b[6][N][N], c[6][N][N], s[12][N][N], p[12][N][N];
	int i, j;
	/*拆分A，B矩阵*/
	for (i = 1; i <= n / 2; i++)
		for (j = 1; j <= n / 2; j++)
		{
			a[1][i][j] = A[i][j];
			b[1][i][j] = B[i][j];
		}
	for (i = 1; i <= n / 2; i++)
		for (j = 1; j <= n / 2; j++)
		{
			a[2][i][j] = A[i][j + n / 2];
			b[2][i][j] = B[i][j + n / 2];
		}
	for (i = 1; i <= n / 2; i++)
		for (j = 1; j <= n / 2; j++)
		{
			a[3][i][j] = A[i + n / 2][j];
			b[3][i][j] = B[i + n / 2][j];
		}
	for (i = 1; i <= n / 2; i++)
		for (j = 1; j <= n / 2; j++)
		{
			a[4][i][j] = A[i + n / 2][j + n / 2];
			b[4][i][j] = B[i + n / 2][j + n / 2];
		}
	/*计算s1-s10*/
	ad(n / 2, b[2], b[4], s[1], 2);
	ad(n / 2, a[1], a[2], s[2], 1);
	ad(n / 2, a[3], a[4], s[3], 1);
	ad(n / 2, b[3], b[1], s[4], 2);
	ad(n / 2, a[1], a[4], s[5], 1);
	ad(n / 2, b[1], b[4], s[6], 1);
	ad(n / 2, a[2], a[4], s[7], 2);
	ad(n / 2, b[3], b[4], s[8], 1);
	ad(n / 2, a[1], a[3], s[9], 2);
	ad(n / 2, b[1], b[2], s[10], 1);
	/*7次递归计算*/
	cal(n / 2, a[1], s[1], p[1]);
	cal(n / 2, s[2], b[4], p[2]);
	cal(n / 2, s[3], b[1], p[3]);
	cal(n / 2, a[4], s[4], p[4]);
	cal(n / 2, s[5], s[6], p[5]);
	cal(n / 2, s[7], s[8], p[6]);
	cal(n / 2, s[9], s[10], p[7]);
	/*计算C11*/
	ad(n / 2, p[5], p[4], c[1], 1);
	ad(n / 2, c[1], p[2], c[1], 2);
	ad(n / 2, c[1], p[6], c[1], 1);
	/*计算C12*/
	ad(n / 2, p[1], p[2], c[2], 1);
	/*计算C21*/
	ad(n / 2, p[3], p[4], c[3], 1);
	/*计算C22*/
	ad(n / 2, p[5], p[1], c[4], 1);
	ad(n / 2, c[4], p[3], c[4], 2);
	ad(n / 2, c[4], p[7], c[4], 2);
	/*将C11,C12,C21,C22合并成C*/
	for (i = 1; i <= n / 2; i++)
		for (j = 1; j <= n / 2; j++)
			C[i][j] = c[1][i][j];
	for (i = 1; i <= n / 2; i++)
		for (j = n / 2 + 1; j <= n; j++)
			C[i][j] = c[2][i][j - n / 2];
	for (i = n / 2 + 1; i <= n; i++)
		for (j = 1; j <= n / 2; j++)
			C[i][j] = c[3][i - n / 2][j];
	for (i = n / 2 + 1; i <= n; i++)
		for (j = n / 2 + 1; j <= n; j++)
			C[i][j] = c[4][i - n / 2][j - n / 2];
	return;
}
void main()
{
	int m, n, i, j, a[N][N] = { 0 }, b[N][N] = { 0 }, c[N][N] = { 0 };
	/*读入*/
	scanf("%d", &n);
	m = n;
	for (i = 1; i <= n; i++)
		for (j = 1; j <= n; j++)
			scanf("%d", &a[i][j]);
	for (i = 1; i <= n; i++)
		for (j = 1; j <= n; j++)
			scanf("%d", &b[i][j]);
	while ((n & (n - 1)) != 0)
		n++;
	/*计算*/
	cal(n, a, b, c);
	/*输出*/
	printf("\n");
	for (i = 1; i <= m; i++)
	{
		for (j = 1; j <= m; j++)
			printf("%4d ", c[i][j]);
		printf("\n");
	}
	getchar();
	getchar();
}

PS:当矩阵规模过大时，可能出现栈溢出。

4.2-3
该思考题提出若 $n$ 不是2的幂时该如何处理。
解决方法很容易：若不是2的幂，则用0扩充矩阵，直至其规模达到2的幂。
PS：若 $(num\&(num-1=0))$ 则 $n u m$ 是2的幂。

4.2-7
题目要求仅用3次实数乘法完成复数 $a + b i 和 c + d i$ 相乘(即得到 $a c - b d 和 a d + b c$ )。
仿照Strassen方法：

令：
$S_1=(a+b)*c=ac+bc$
$S_2=(c+d)*b=bc+bd$
$S_3=(b-a)*d=bd-ad$
则：
$ac-bd=S_1-S_2$
$ad+bc=S_2-S_3$

mahaoyuan2015

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【算法导论】4.2

矩阵乘法的 Strassen 算法朴素算法时间复杂度:Θ(n3)Θ(n^3)Θ(n3)；一般分治算法：(1)A=[A11A12A21A23]&amp;amp;nbsp;&amp;amp;nbsp;B=[B11B12B21B23]&amp;amp;nbsp;&amp;amp;nbsp;C=[C11C12C21C23]A=\left[ \begin{matrix} A_{11} &amp;amp;amp;amp; A_{12} \\ A_{21}
复制链接

扫一扫