最长公共子序列问题:给你两个字符串a[m],b[n],求出他们的公共子字符串的长度(子字符串不需要再原字符串中连续)。
这个问题的一般想法是:
1.找出a[m]中的每个子字符串;
2.看其是否也能存在在b[n]中;
3.找出公共子字符串中最大的一个。
然而这个方法对于计算机来说实在是过于复杂,比较好的方法是使用动态规划的方法:
首先这是一个比较复杂的问题,我们需要将它分为一些简单的小问题来解决,最常见的方式就是找到递推规律,然后就能将一个复杂的问题分成一步一步来解决。来看这个问题,我们需要找出这个问题的地推公式,研究我们若已近找到a[1,2.....i]与b[1,2,....j]的公共子序列的情况下,关于a[1,2,.....i+1],b[1,2,....j+1]的公共子序列的问题。设cs[k]=LCS(i,j)为a[1,2.....i],b[1,2,....j]的公共最长子序列,c(i,j)为其长度:
(1)若a[i]=b[j],则显然c(i,j)=c(i-1,j-1)+1
(2)若a[i]!=b[j],则有三种情况需要考虑:
- cs[k]=a[i],cs[k]!=b[j],则cs[k]=LCS(i,j)为a[1,2.....i],b[1,2,....j-1]的公共最长子序列
- cs[k]=b[i],cs[k]!=a[j],则cs[k]=LCS(i,j)为a[1,2.....i-1],b[1,2,....j]的公共最长子序列
- cs[k]!=a[i],cs[k]!=b[j],则cs[k]=LCS(i,j)为a[1,2.....i-1],b[1,2,....j-1]的公共最长子序列
综上所述,有c[i,j]=max{c[i-1,j],c[i,j-1]},即求出了递推公式。如果直接用递归可以看出,若a[i]!=b[j],每次递归都要调用两次递归,计算的复杂度是程二叉树增加的。而这些递归的问题很有可能是已经解决过了的,也就是存在重叠子问题的情况,如果可以避免重复计算这些问题,就可以大大减少计算量,因此我们可以将这些解决过的问题储存起来,下次再碰到就不需要重新计算了。再来看这个问题的模型,我们可能碰到的子问题的形式都是c(x,y)的形式,x属于[0,n],y属于[0,m],因此我们可以建立一个二维数组来储存,由递推公式将二维数组一步一步填满,最后求出c(n,m)。