动态规划-最大公共子序列问题(MCS)和最长公共子串问题(LCS)_动态规划最大公共子序列a:xzyzzyxb:zxyyzxz 最大公共子序列长度c[i][j]和最优解-CSDN博客

本文链接：https://blog.csdn.net/KARLGong/article/details/133935134

最大公共子序列问题

子序列定义

一个序列去掉任意零个或多个元素剩余的序列。

问题的形式化定义

给定两个序列 $X=(x_1, x_2,...,x_m)$ ， $Y=(y_1, y_2,...,y_n)$ ，求一个最长的公共子序列 $Z=(z_1, z_2,...,z_k)$ ，使对于所有的 $p = 1, 2, ..., k$ ，有 $z_p=x_{i_p}=y_{j_p}$ 。

第一步：定义最优解

定义 $d_{i,j}$ 为序列 $X[1,\dots,i]$ 和 $Y[1,\dots,j]$ 的最长公共子序列长度。

第二步：建立递推关系

我们从两个序列的末尾开始向开头进行递推，这样在后续自底向上填表时就能从序列头进行填写。

如果两个序列的末尾元素是相同的，那么递推关系有三种情况：
$d_{i,j}=max\begin{cases}d_{i-1,j-1}+1\\d_{i-1,j}\\d_{i,j-1}\\\end{cases}( X[i]=Y[j])$
事实上， $d_{i-1,j}$ 或 $d_{i,j-1}$ 至多比 $d_{i-1,j-1}$ 大1。因此递推中第一种可能一定大于等于第二、第三种可能。可以仅保留第一项：
$d_{i,j}=d_{i-1,j-1}+1 (X[i]=Y[j])$
即相同的最后元素一定要被加入最长的公共子序列中。

如果两个序列的末尾元素是不同的，递推关系无非两种情况：
$d_{i,j}=max \begin{cases}d_{i-1,j}\\d_{i,j-1}\\\end{cases} (X[i]\neq Y[j])$

综上所述，递推关系为：
$d_{i,j}=\begin{cases} d_{i-1,j-1}+1(X[i]= Y[j])\\ max\{d_{i,j-1}, d_{i-1,j}\}(X[i]\neq Y[j])\\ \end{cases}$

第三步：自底向上计算（填表）与最优方案追踪

以 $X = A BCB D A B$ ， $Y = B D C A B A$ 为例。
为了追踪最优方案，应该记录每次递推时是从 $d_{i-1,j-1}$ , $d_{i-1,j-1}$ 还是 $d_{i,j-1}$ 得来，分别采取的操作是什么。建立追踪表，如果是从左上角推得（即元素相等），填写LU；如果是从左边推得，填写L；如果是从上面推得，填写U。

Step 0

初始化表格：

	1	2	3	4	5	6
0	0	0	0	0	0	0
1
2
3
4
5
6
7

追踪表：

	0	1	2	3	4	5	6
0	x	x	x	x	x	x	x
1	x
2	x
3	x
4	x
5	x
6	x
7	x

Step 1

因为 $X[1]\neq Y[1]$ ， $d_{1,1}=max\{d_{0,1},d_{1,0}\}=0$

	1	2	3	4	5	6
0	0	0	0	0	0	0
1	0
2
3
4
5
6
7

追踪表：
当上面和左边的值相等时，不妨记为从上面推得。

	0	1	2	3	4	5	6
0	x	x	x	x	x	x	x
1	x	U
2	x
3	x
4	x
5	x
6	x
7	x

…

Step N

因为 $X[7]\neq Y[6]$ ， $d_{7,6}=max\{d_{7,5},d_{6,6}\}=0$

	1	2	3	4	5	6
0	0	0	0	0	0	0
1	0	0	0	1	1	1
2	1	1	1	1	2	2
3	1	1	2	2	2	2
4	1	1	2	2	3	3
5	1	2	2	2	3	3
6	1	2	2	3	3	4
7	1	2	2	3	4	4

追踪表：

	0	1	2	3	4	5	6
0	x	x	x	x	x	x	x
1	x	U	U	U	LU	L	LU
2	x	LU	L	L	U	LU	L
3	x	U	U	LU	L	U	U
4	x	LU	U	U	U	LU	L
5	x	U	LU	U	U	U	U
6	x	U	U	U	LU	U	LU
7	x	LU	U	U	U	LU	U

从 $d_{7,6}$ 倒推得到的序列为：LU,L,LU,L,LU,U,LU,U，其中LU符号代表这个元素在公共子序列中。
个 $X$ 与 $Y$ 的4个公共子序列元素为： $X [2]$ ， $X [3]$ ， $X [4]$ ， $X [6]$ 。即 $BCB A$ 。

最长公共子串问题

子串定义

给定串中零个或多个连续的元素（如字符）组成的子序列。

问题的形式化定义

给定两个串 $X=x_1x_2...x_m$ ， $Y=y_1y_2...y_n$ ，求一个最长的公共子串 $Z=z_1 z_2...z_k$ ，使得存在下标 $i$ 和 $j$ 使得 $x_ix_{i+1}...x_{i+k-1}$ = $y_jy_{j+1}...y_{j+k-1}$ 。

第一步：定义最优解

定义 $d_{i,j}$ 为串 $X[1,\dots,i]$ 的以 $X [i]$ 结尾的和 $Y[1,\dots,j]$ 的以 $Y [j]$ 结尾的最长的公共子串的长度。注意这样定义的 $d_{m,n}$ 一般不是我们需要的解的长度，我们最终要求的最优解的长度应该是 $max\{d_{i,j}\}$ 。这里是为了便于建立递推关系，用到一种添加约束的小技巧，而不是直接去定义最优解的结构。

第二步：建立递推关系

如果两个串的末尾元素是相同的，那么递推关系就是：
$d_{i,j}=d_{i-1,j-1}+1(X[i]=Y[j])$
如果两个串的末尾元素不相同，递推终止：
$d_{i,j}=0 (X[i]\neq Y[j])$
综上所述，递推关系为：
$d_{i,j}=\begin{cases} d_{i,j}=d_{i-1,j-1}+1(X[i]=Y[j])\\ d_{i,j}=0 (X[i]\neq Y[j])\\ \end{cases}$