一、最长公共子序列
首先区别一下子串与子序列,子串要求是连续的而子序列不要求连续。例如ABCDEG字符串, ABC为子串,ADG为子序列。
设有两个字符串数组 str1【N】和str2【M】,构建二维数组DP【N】【M】,其中DP【i】【j】的含义:字符串str1【0……i】与str2【0……j】的公共子序列的长度。
我们来分析DP【i】【j】的来源,
1、首先DP【i】【j】的值不会小于DP【i-1】【j-1】,如果str1【i】==str2【j】,则DP【i】【j】 = DP【i-1】【j-1】+1。
2、如果str1【i】!= str2【j】,DP的来源于max( DP【i】【j-1】,DP【i-1】【j】),
此时不用考虑DP【i-1】【j-1】,因为:
DP【i】【j-1】>=DP【i-1】【j-1】,
DP【i-1】【j】>=DP【i-1】【j-1】
( 没看明白可以这样考虑:
str1【0……i】与str2【0……j-1】 的公共子序列肯定不会比str1【0……i-1】与str2【0……j-1】的公共子序列小,
同理str1【0……i-1】与str2【0……j】的公共子序列肯定不会比str1【0……i-1】与str2【0……j-1】的公共子序列小。)
所以选取这两个最大一个即可。
明白DP【i】【j】的含义,以及DP【i】【j】的推导后,我们再来看如何构造DP【N】【M】数组。
1、首先构造第一行,
DP【0】【0……M-1】代表字符串str1【0……0】与str2【0……M-1】的最长公共子序列,
可以看出这一行的值,不为1就为0,
且当DP【0】【K】为1时(含义:str1【0】 ==str2【K】&&str1【0】!=str2【0……K-1】) DP【0】【K+1……M-1】均为1。
2、构造第一列,
DP【0……N-1】【0】代表str1【0……N-1】与str2【0……0】的最长公共子序列,
可以看出这一列的值同第一行一样,不为1就为0,
且当DP【K】【0】为1时(含义:str1【K】 ==str2【0】&&str1【0……K-1】!=str2【0】) DP【K+1……M-1】【0】均为1。
3、知道了第一行和第一列的值,可以根据求得其他所有矩阵中的值。
构造DP【N】【M】之后,就可以根据DP【N】【M】来求得最长公共子序列。
1、首先从右下角开始,DP【N-1】【M-1】,如果str1【N-1】 == str2【M-1】 则说明str1【N-1】一定是最长公共子序列中的一个数,得记录下来
2、如果str1【N-1】 != str2【M-1】,则不用记录str1【N-1】或str2【M-1】,这时需要向上(DP【i-1】【j】)移动或者向左
(DP【i】【j-1】)移动,看这两个值哪个大,谁大往谁的方向移。(可以这样理解,既然我们这个点str1【N-1】与str2【M-1】不同,但是此时最大递增子序列的长度应该是不变的,所以应该向DP【】【】值不变的方向移动,回想起我们在创建DP【】【】数组时,当str1【N-1】 != str2【M-1】,DP【N-1】【M-1】的来源是左边和上边其中的较大值。所以应该向左边和上边中的较大值移动)
3、每到str1【K1】 == str2【K2】 记录下str1【k1】,不相等时,向左和上的较大值移动,直到DP【K1】【k2】==0终止。
如上图的例子:str1 = “xi A B C B D A B” str2 = "yj B D C A B A"
代码:
// write your code here cpp
#include<iostream>
#include<string>
#include<vector>
using namespace std;
int Max(int a,int b)
{
return (a>b)?a:b;
}
void creatDp(string s1,string s2,int *dp)
{
int len1 = s1.length();
int len2 = s2.length();
//int *dp = new int[len1*len2];
//先求出第一行
for(int j = 0;j<len2;j++)
{
if(s1[0] == s2[j]){
*(dp+0*len2+j) = 1;
for(;j<len2;j++)
*(dp+0*len2+j) = 1;
break;
}
else
*(dp+0*len2+j) = 0;
}
//然后求第一列
for(int i = 0;i<len1;i++)
{
if(s1[i] == s2[0]){
*(dp+i*len2+0) = 1;
for(;i<len1;i++)
*(dp+i*len2+0) = 1;
break;
}
else
*(dp+i*len2+0) = 0;
}
//求其他的数据
for(int i =1;i<len1;i++)
{
for(int j =1;j<len2;j++)
{
if(s1[i] == s2[j])
*(dp+i*len2+j) = *(dp+(i-1)*len2+(j-1))+1;
else
*(dp+i*len2+j) = Max(*(dp+(i-1)*len2+j),*(dp+i*len2+j-1));
}
}
//这个值记录着最大公共子序列的长度
//cout<<dp[len1*len2-1];
}
void getLCS(int *dp,string s1,string s2)
{
int len1 = s1.length();
int len2 = s2.length();
int i = len1-1;
int j = len2-1;
int len = dp[i*len2+j];
char *result = new char[len];
int k =len-1;
while(*(dp+i*len2+j)!=0&&i>=0&&j>=0){
if(s1[i] == s2[j]){
result[k--] = s1[i];
i--;j--;
}
else
{
if(*(dp+(i-1)*len2+j) > *(dp+(i)*len2+j-1))
i--;
else
j--;
}
}
for(int i = 0;i<len;i++)
cout<<result[i]<<" ";
cout<<endl;
}
int main()
{
string s1 ;
string s2 ;
while(cin>>s1>>s2){
int len1 = s1.length();
int len2 = s2.length();
int *dp = new int[len1*len2];
creatDp(s1, s2,dp);
getLCS(dp,s1,s2);
delete[] dp;
}
return 0;
}
测试:
abcfbc abfcab programming contest abcd mnp
应用:例如给你一个字符串,可以从中删除一些字符,使得剩下的串是一个回文串。如何删除才能使得回文串最长呢?
就是该字符串的大小和 该串与反串的最大公共子序列 的差值。