题意简述:两个字符串都仅由小写字母构成,且长度不超过80。要求按照字典序无重复的输出所有的最长公共子序列。
原题链接:POJ1934
解题思路:都是这种题怎么能怪我不学习?我昨天用我自己的思路写了一天,经过昨天一天的改进,还是有各种错误,我都没法证明为什么错了,而且我觉得我写的明明和这个解法异曲同工!
首先是求出最长公共子序列,我的写法是O(n^2)级别的,好在数据中的n只有80。有些棘手的是无重复的输出所有公共子序列。
我们可以想到的一种解法是,假设最长公共子序列长度为 p ,那么我们只需要找到每个位置上能够放哪些字母,使得最终序列长度为 p ,接下来只要dfs一遍就能求出所有子序列了。有了这个思路,那问题就转化成了如何求每个位子上能放哪些字母?既然我们是根据 p 来找字母的,我们知道当LCA[ n ][ m ] = p,且str1[ n ] == str2[ m ],那么str1[ n ]这个字母就能放在 p 这个位置上了。
根据上述思路,我们只需要找到所有LCA[ n ][ m ] = p,且str1[ n ] == str2[ m ]的 n 和 m ,就可以找到p位置上所有可能的字母。但是不管怎么说O(n^3)级别即使对于80来说也太勉强了,所以需要用动态规划来优化到O( n )级别。假设loc[ i ][ j ]存放一个字符串前 i 个字母中,‘a'+j最后一次出现的位置。很显然,状态转移方程为:
loc[ i ][ j ] = i (str[ i ] == 'a' + j)
loc[ i ][ j ] = loc[i - 1][j] (str[ i ] != 'a' + j)
那么这个loc[][]辅助数组有什么用呢?当我们从p位置(从后向前)找合适的字母时,我们可以通过LCA[ loc1( n )( j ) ][ loc2( m )( j ) ] == p来找所有LCA为p的字母(最多26个),如此一来 n 可更新为 loc1( n )( j ),而 m 可更新为 loc2( m )( j ),而不是仅仅减去1(因为当找 p-1 位置上字母时,显然 n 后面的LCA肯定大于p-1,故只需考虑前面)。
代码示例:
#include<cstdio>
#include<iostream>
#include<cstring>
#include<string>
#include<set>
using namespace std;
const int maxn = 100;
string str1,str2;
char ans[maxn];
int dp[maxn][maxn];
int loc1[maxn][30],loc2[maxn][30];
set<string> s;
void dfs(int n,int m,int p){
if(p == 0){
string tmp;
for(int i = 0;i < dp[str1.length()][str2.length()];i++)
tmp += ans[i+1];
s.insert(tmp);
return;
}
if(str1[n-1] == str2[m-1]){
ans[p] = str1[n-1];
dfs(n-1,m-1,p-1);
return;
}else{
for(int i = 0;i < 26;i++){
if(dp[loc1[n][i]][loc2[m][i]] == p){
dfs(loc1[n][i],loc2[m][i],p);
}
}
}
}
void solve(){
memset(dp,0,sizeof dp);
s.clear();
int a = str1.length();
int b = str2.length();
//更新LCA
for(int i = 1;i <= a;i++){
for(int j = 1;j <= b;j++){
if(str1[i-1] != str2[j-1])
dp[i][j] = max(dp[i-1][j],dp[i][j-1]);
else
dp[i][j] = max(dp[i][j],dp[i-1][j-1]+1);
}
}
//更新loc
for(int i = 1;i <= a;i++){
for(int j = 0;j < 26;j++){
if(str1[i-1] == 'a'+j) loc1[i][j] = i;
else loc1[i][j] = loc1[i-1][j];
}
}
for(int i = 1;i <= b;i++){
for(int j = 0;j < 26;j++){
if(str2[i-1] == 'a'+j) loc2[i][j] = i;
else loc2[i][j] = loc2[i-1][j];
}
}
//求所有序列
dfs(a,b,dp[a][b]);;
set<string>::iterator it = s.begin();
for(it; it != s.end();it++)
cout << *it << endl;
}
int main(){
//freopen("123.in","r",stdin);
while(cin >> str1 >> str2 ){
solve();
}
return 0;
}