题意
给两个字符串s1,s2,在s1中找一个子序列(subsequence)s0, s0的字典序大于s2,求子序列s0长度的最大值。
序列自动机
其实就是一个二维数组,s[i][j]记录了字符串第i位置之后(不包括第i位置)的第一个字母j的位置。j 表示的是 ch - ' a ' 。
void init()
{
for(int i=n;i>=1;i--){
for(int j=0;j<26;j++){
s[i-1][j] = s[i][j];
}
s[i-1][a[i]-'a'] = i;
}
}
substring和subsequence的区别:
substring :字符串的一段连续的子串,用KMP
subsequence :字符串的可以不连续的子串,用序列自动机
思路
初始化好序列自动机的数组,0表示后面没有这个数了。
找所有(其实也不是所以)满足要求的子序列,求最大长度就行了。
满足要求的子序列有两种情况:
字符串s0和s2前面一样,s0从某一位比s2大,那就肯定比s2大了,把那一位后面的全部加上去。
另一种是s2和s0的前缀完全一样,s0比s2的位数多,最后特判一下,如果最后走到了最后的n位置,后面没有了,得到的s0是和s2相等的,所以不满足。
#include<cstdio>
#include<iostream>
#include<algorithm>
#include<cstring>
using namespace std;
const int N = 1e6+10;
int s[N][26],n,m;
char a[N],b[N];
void init()
{
for(int i=n;i>=1;i--){
for(int j=0;j<26;j++) s[i-1][j] = s[i][j];
s[i-1][a[i]-'a'] = i;
}
}
int main()
{
scanf("%d%d",&n,&m);
scanf("%s%s",a+1,b+1);
init();
int ans = 0,p=0,flg=1;
for(int i=1;i<=m;i++){
int t = b[i]-'a';
for(int j=t+1;j<26;j++){
if(s[p][j]>0) ans = max(ans,n-s[p][j]+i);
}
p = s[p][t];
if(p==0){
flg = 0;
break;
}
}
if(flg&&p!=n){
ans = max(ans,m+n-p);
}
if(ans==0) printf("-1\n");
else printf("%d\n",ans);
return 0;
}