迭代回溯法解决矩阵乘法链问题（C++）

int_man

已于 2023-12-23 19:05:24 修改

阅读量1k

点赞数 28

文章标签：矩阵 c++ 算法深度优先

于 2023-12-23 18:59:31 首次发布

本文链接：https://blog.csdn.net/int_man/article/details/135172189

版权

前言

问题分析

第一步：如何形式化表示所有可能的不同矩阵乘法次序

第二步：如何使用回溯法找到最小的矩阵乘法次数

如何在展开这棵树的过程中记录乘法次数？

如何描述一个节点的路径？

如何描述delt_s?

当到达叶子结点后，虽然已知所有分段点所需的乘法次数为s+delt_s，但是剩余的乘法次数怎么求？

第三步：限界剪枝的方法

1、限界1：不能重复选取已经选过的分割点位置

2、限界2：如果当前节点的可行解乘法次数下界大于等于best

前言

最近笔者有个大作业是“回溯法解决矩阵乘法链的最小乘法次数问题”，而且要做PPT，笔者觉得自己对此问题的分析和C++代码可能对其他人有帮助，今天就把PPT内容搬过来了。矩阵乘法链问题具体是什么就不多赘述了，不了解的小伙伴可以自行搜索。

问题分析

第一步：如何形式化表示所有可能的不同矩阵乘法次序

注：这里的“不同”指的是“括号”层面的不同，而不是“乘号顺序”上的不同。举个例子：对于A*B*C*D来说，一共三个乘号，标号为1、2、3，那么对于计算时不同的乘法顺序“1 3 2”和“3 1 2”这两者，由于先算3还是先算1是一样的，这里认为是“相同的乘法次序”。至于为什么管这个叫做“括号层面的不同”，是因为“1 3 2”和“3 1 2”的乘法顺序用含有最少括号的表达式来表示都是A*B*(C*D)。区分上边这两种表示方式，对下文的理解十分重要。

第一种：对于每个乘号排序

例如A*B*C*D,一共有三个乘号，分别编号为1、2、3。则所有可能的顺序有A_3^3=6种，分别为(用最少得括号表示)：

1 2 3：A*B*C*D

1 3 2：A*B*(C*D)

2 1 3：A*(B*C)*D

2 3 1：A*((B*C)*D)

3 1 2：A*B*(C*D)

3 2 1：A*(B*(C*D))

可以发现，在上面六种情况中132和312是重复的，在这两种情况中先计算第一个乘号还是先计算第三个对所用的乘法次数以及结果一定没有影响，为了避免这种冗余，需要另一种形式来表示对总乘法次数不同的乘法次序。

第二种：分割乘法链（加括号）

观察矩阵乘法的规律：当矩阵乘法链中只有一个矩阵，所用乘法次数是固定的0；当乘法链中有两个矩阵，所用的乘法次数也是确定的，只有一种；当乘法链中有三个矩阵，可能的乘法次序不唯一，显然有两个。

想要让三个矩阵的乘法链具有确定的乘法次序，需要将其拆分成“长度为一的乘法链”和“长度为二的乘法链”的组合，并且显然有：越靠前的分割点处的乘法越后算。

例子：

A*B*C，一共有两种切割方式(切一刀即可将其分为len=1or2的乘法链的组合)：(A*B)*(C) 、(A)*(B*C)。

方法描述：

对整个矩阵乘法链（长度>=3）在乘号处进行切割，当最长子链长度<=2时产生一种可能且确定的乘法次序，由此方法产生的所有乘法次序在总乘法次数方面没有冗余。

例子（融入回溯思想）：

对于A*B*C*D，第一个切割点可以选在第一个乘号处，于是得到(A)*(B*C*D) ，但此时并不满足max_len==2的条件，继续分割；下一个分段点不能继续选在第一个乘号处，于是向后顺序搜索，可以选在第二个乘号处，得到(A)*((B)*(C*D))，此时得到一个满足条件的清晰的乘法次序。使用这种回溯的搜索方法可以得到一个描述所有乘法次序的树：

上面的树(数字表示在哪个矩阵前切割)的叶子结点和后面的五个乘法次序分别对应：A*(B*(C*D))、A*((B*C)*D)、A*B*(C*D)、(A*B*C)*D、(A*(B*C))*D。观察发现，和上一个方法（乘号排序）相比，此方法确实没有冗余。

第二步：如何使用回溯法找到最小的矩阵乘法次数

不难看出，只要能在“上页中能遍历“所有不同乘法总数的乘法次序”的树“中遍历每一个叶子结点对应的所需乘法次数并找到最小值，即可在遍历结束后找到最小的乘法次数（暴力搜索）。为了节约时间，可以一边生成这棵树一边更新best（最小的乘法次数）值。

如何在展开这棵树的过程中记录乘法次数？

观察路径“3”对应的加括号的方式”(A*B)*(C*D)”（在第三个矩阵前加括号）可以看出，总共需要的乘法次数可以分类为两种：

1、由于切割矩阵乘法链导致的已经确定的乘法次数

2、在没有被切割的乘号处，但是由于此乘号所在的乘法链长度为2，这个乘号的所需的已确定的乘法次数。

类似于01背包问题中的s迭代量，在此算法中可以用s表示当前已经确定了的分割点对应的所需乘法次数的和，于是在每次回溯和展开节点的时候，都要对s进行修改，以与当前路径匹配。每当到达叶子结点，可得到一个总的所需乘法次数，即为s与剩下的乘号所需乘法次数的和，这是易于计算的。为了存储最优值，使用best变量，每到达一个叶子节点就使用当前节点对应的乘法次数的值更新best。不过，在讨论如何计算每一步s的增量delt_s之前，先要讨论下面这个问题。

如何描述一个节点的路径？

由于此算法是迭代回溯，可以将路径保存在一个迭代量中，比如v[1:n]，这样的数组不仅能描述一个节点对应的分割点的位置，还能表示分割点的次序，足以表征一个节点路径的有效信息，可以满足算法需要。但是在想要观察矩阵链整体分割情况的时候（比如查看最大子链长度），那就要对分割点进行排序，最快也要额外造成nlogn量级的时间复杂度，于是可以使用有序链表list来描述分段点的位置，这样一来，每次查询相关信息只要线性时间即可。

例如路径“42”对应的加括号的方式”(A*(B*C))*D”（在第三个矩阵前加括号）,对应的v[1:n]为{4,2},而list={2,4}。可见list中的内容和分断点的顺序无关，只是为了快速查询

如何计算每一步的s的增量delt_s？

首先，使用数组r[1:n+1]形式化描述一个矩阵乘法链

例如：（矩阵中间为矩阵编号1~n）

这些矩阵的大小如图所示，例如矩阵2为“r2*r3”的大小。

如何描述delt_s?

观察例子：对于上图使用42的分割顺序，那么当分割矩阵2前的乘号的时候，造成的delt_s为多少？

由上图不难看出，在2前切割导致的乘法次数是r1*r2*r4，可以看出，此次分割所需要的乘法次数即为此次分割产生的两个子链中“前方子链中第一个矩阵的行数（记作a）”乘以“前方子链中最后一个矩阵的列数或后方子链中第一个矩阵的行数”再乘以“后方子链中最后一个矩阵的列数(记作b)”。

由于a和b都是r数组中的元素，且该元素的下标与之前已经选过的分段点的位置有关，所以可以通过查询该分段点前方和后方最近的分段点位置得到这个a和b的下标ra和rb。于是delt_s = r[ra] * r[rb] * r[v[k]] （v[k]是当前节点选择的分段点的位置）。但是想要得到一个可行解（叶子结点）的总共的乘法次数，如何得到？

当到达叶子结点后，虽然已知所有分段点所需的乘法次数为s+delt_s，但是剩余的乘法次数怎么求？

观察上图可知，在这个矩阵乘法链中一共有n-1=3次乘法，由于分割已经解决了其中的两个乘法，接下来只需要求得仅剩的一个乘法（即在矩阵2、3之间的乘法）的所需乘法次数即可。

实现方法：在list中添加1和n+1两个元素作为边界，然后遍历，若发现相邻两元素差为2，则找到一个需要计算的乘法，总共需要的额外的乘法次数记为rest，则每找到一个就rest+=此次乘法需要的乘法次数。

在这个例子中，list一开始是{2,4},加入1和n-1后变成了{1 2 4 5} 遍历发现2 4之间相差2，于是找到一个需要额外加入的乘法于是rest(初始为0)对应地自增r[2]*r[3]*r[4]，这一操作重复直到遍历list结束。最后把s+delt_s+rest作为当前叶子结点的乘法次数即可，并更新best的值（若小于best）。