题目:
给两个字符串a,b,找出他们两的最长公共子序列长度,和一个最长公共子序列。
比如:a = “ABCBDAB”, b = “BDCABA”;
则最大子序列长度是4,满足的子序列有B D A B。
思路:
注意是子序列,不是子串,子序列不要求连续。
动态规划。
dp[i][j]表示字符串a从0~i位置,字符串b从0~j位置,此时的最长公共子序列。
如果i位置与j位置对应的字符相同,那么当前位置的LCS的长度等于上一个位置的LCS长度+1,即为dp[i][j]=dp[i-1][j-1]+1;
如果i位置与j位置对应的字符不相同,可能会是i-1位置与j位置字符相同,也可能是i与j-1位置字符相同。那么当前位置的LCS的长度要么等于(i-1,j)位置的,要么等于(i,j-1)位置的。dp[i][j]=max(dp[i-1][j],dp[i][j-1]);
再用一个二维数组记录路径。
seq=”“;代表我们要找的子序列
path[n][m]
如果a[i]=b[j],那么path[i][j]此处对应的状态设为0,可以加入到seq中;
如果a[i]≠b[j],那么path[i][j]为1表示从(i-1,j)到(i,j),如果path[i][j]为-1表示从(i,j-1)到(i,j)
我们根据记录的路径状态递归回溯将相同的字符加入到seq中。
代码:
#include<iostream>
#include<string>
#include<vector>
#include<algorithm>
using namespace std;
int findLongestCommonSubsequenceLength(string &a,string& b,vector<vector<int>> &path){
int la = a.size();
int lb = b.size();
vector<vector<int>> dp(la+1,vector<int>(lb+1,0));
for (int i = 1; i <= la; i++){
for (int j = 1; j <= lb; j++){
if (a[i-1] == b[j-1]){
dp[i][j] = dp[i-1][j-1] + 1;
path[i][j] = 0;
}
else{
dp[i][j] = max(dp[i - 1][j], dp[i][j - 1]);
path[i][j] = dp[i - 1][j] > dp[i][j - 1] ? 1 : -1;
}
}
}
return dp[la][lb];
}
void LongestCommonSubsesequence(int i,int j,string &seq,vector<vector<int>> &path,string &a){
if (i < 1 || j < 1){
return;
}
if (path[i][j] == 0){
LongestCommonSubsesequence(i-1,j-1,seq,path,a);
seq += a[i-1];
}
else if (path[i][j] == 1){
LongestCommonSubsesequence(i-1,j,seq,path,a);
}
else if (path[i][j] == -1){
LongestCommonSubsesequence(i,j-1,seq,path,a);
}
}
int main()
{
string a = "ABCBDAB";
string b = "BDCABA";
int la = a.size();
int lb = b.size();
vector<vector<int>> path(la + 1, vector<int>(lb + 1));
printf("%d\n", findLongestCommonSubsequenceLength(a, b,path));
string seq;
LongestCommonSubsesequence(la,lb,seq,path,a);
cout << seq;
system("pause");
return 0;
}
补充:
其实求最长回文子序列也可以用最长公共子序列啊,把字符串逆序后,与原字符串找它们之间的最长公共子序列长度,即为,原字符串的最长回文子序列