LCS是一个很基础的DP问题,最近看的一些东西的根源都是这个问题,在此总结一下。
设两个序列为a,b,First(a)表示a的第一个元素,Rest(a)表示除第一个元素以外的a的剩余元素组成的序列
LCS(a,b)表示a,b的最长公共子序列数目,则:
LCS(a,b) = { 1+LCS(Rest(a),Rest(b)), First(a)=First(b)
{ MAX( LCS(a,Rest(b)) , LCS(Rest(a),b) ), First(a)!=First(b)
思路:当两个序列首元素相同时,当前LCS为两个序列(除首元素外)剩余序列的LCS值+1;否则,为第一个序列和第二个剩余序列的LCS、第一个剩余序列和第二个序列LCS的最大值。
这个算法用递归很好实现,搜索空间为n^2,但是不难发现,在每一步计算时,当前的LCS(a,b)可能已经被之前的递归步骤计算过了。所以,可以运用动态规划,计算每一步的状态并求解。
设dp[i][j]表示以a[i]和b[j]开始的子序列的LCS值,则递归方程为:
a[i]==b[j], dp[i][j] = 1+lcs(i+1,j+1)
a[i]!=b[j], dp[i][j] = MAX(lcs(i+1,j),lcs(i,j+1))
再注意递归边界即可。
代码如下:
#include<iostream>
#include<cstdio>
#include<string>
#include<cstring>
using namespace std;
const int maxn = 100;
string a,b;
int n,m;
int dp[maxn][maxn];
int MAX(int x,int y)
{
return x>y?x:y;
}
int lcs(int i, int j)
{
if(i>=n || j>=m)
return 0;
if(dp[i][j]>=0)
return dp[i][j];
if(a[i]==b[j])
dp[i][j] = 1+lcs(i+1,j+1);
else
dp[i][j] = MAX(lcs(i+1,j),lcs(i,j+1));
return dp[i][j];
}
int main()
{
a = "ABAC";
b = "DADDAC";
n = a.length();
m = b.length();
memset(dp,-1,sizeof(dp));
cout<< lcs(0,0) << endl;
}