最长公共子序列
题目描述
给你一个序列X和另一个序列Z,当Z中的所有元素都在X中存在,并且在X中的下标顺序是严格递增的,那么就把Z叫做X的子序列。
例如:Z=<a,b,f,c>是序列X=<a,b,c,f,b,c>的一个子序列,Z中的元素在X中的下标序列为<1,2,4,6>。
现给你两个序列X和Y,请问它们的最长公共子序列的长度是多少?
输入
输入包含多组测试数据。每组输入占一行,为两个字符串,由若干个空格分隔。每个字符串的长度不超过100。
输出
对于每组输入,输出两个字符串的最长公共子序列的长度。
样例输入
abcfbc abfcab
programming contest
abcd mnp
样例输出
4
2
0
子序列:与原序列顺序相关的一个原序列的一个子集
例如:ABCSCY 的一个子序列 BSY
公共子序列即两个序列共有的一段子序列,例如ABCSCY和ABFSGP都有BSY序列
所以最长公共子序列即是两端字符串的公共子序列最长的一段
问题求解
1.暴力法
这里涉及到排列组合,与字符串的长度呈指数相关
2.动态规划
2.1找子问题,考虑两条子序列的最后一位
设A= a1,a2,a3,a4…ax B = b1,b2,b3,…by 求最长公共子序列Lcs(x,y)=Z=z1,z2…zm;Z的长度计为lcs(x,y)
(1)ax = by
假设Ax和By的最后一位 ax=by=t , 则 Z的最后一位Lcs(x,y)=zm=t
证明:(反证法)Lcs(x,y)的最后一位为Aa=Bb不为t,且a<x,b<y,则可以把t加到公共子序列的后面得到更长的序列,与假设矛盾
所以zm=t
有了zm=t 就可以得到 当Ax = By时 有 lcs(x,y) = lcs(x-1,y-1)+1
(2)Ax≠By
这里设Lcs(x,y)的最后一位为t
(2.1)t≠ax,有lcs(x,y)=lcs(x-1,y)
(2.2)t≠by,有lcs(x,y)=lcs(x,y-1)
由于两种情况都可能发生 所以根据最长公共子序列的定义 lcs(x,y)=max(lcs(x-1,y),lcs(x,y-1))
(3)当Ax或By为空序列的时候lcs(x,y)=0
所以得到以下递推关系式
lcs(x,y) =
(1)lcsx-1,y-1)+1(ax=by=t)
(2)max(lcs(x-1,y),lcs(x,y-1))(t≠ax,t≠by)
(3)0 Ax或By为空
找到了递推关系式,就有了两种想法:①利用递推关系式递归,从后往前退②利用动态规划,从前往后推,这里由于递推关系式中存在过多的重叠子问题例如:lcs(x-1,y)中就包括lcs(x-1,y-1)在求解的时候就会多次重复求解,造成时间复杂度提高,所以这里选择使用动态规划从前往后推,将子问题的解存储到数组中备用,从而降低时间复杂度
由上面的递推关系式很容易就会想到用一个二维数组c[m][n]存子问题的结果
以下是数组的递推表达式
由这个二维数组可以很容易得到最长公共子序列的长度,但如何得到最长功能公共子序列本身呢?
通过回溯二维数组,以下面这张图为例,我们可以很容易看到二维数组的求解过程
当发生ax