题目描述:
总字符数均 ≤ 1 0 6 \le10^6 ≤106的两篇文章 S , T S,T S,T,把 T T T中的单词替换成某一个单词且不同单词对应不同替换后能与 S S S中连续的一段匹配,求最早可能匹配到到的位置。
题目分析:
相同的单词对应的单词也是相同的,所以只需要比较每个单词与前面最近的与它相同的单词的距离,如果 S S S和 T T T中的距离相同则可以匹配,用Trie树可以方便快速地找前一个相同单词。
Code:
#include<bits/stdc++.h>
#define maxn 1000005
using namespace std;
int n,m,a[maxn],b[maxn],last[maxn],ch[maxn][26],sz,fail[maxn]={-1};
char s[maxn];
void insert(int *a,int &n,char *s){
int len=strlen(s),r=0,v;
for(int i=0;i<len;i++,r=ch[r][v])
if(!ch[r][v=s[i]-'a']) ch[r][v]=++sz;
a[n]=n-last[r],last[r]=n,n++;
}
int main()
{
memset(last,-1,sizeof last);
while(scanf("%s",s),s[0]!='$') insert(a,n,s);
memset(last,-1,sizeof last);
while(scanf("%s",s),s[0]!='$') insert(b,m,s);
for(int i=0,j=-1;i<m;fail[++i]=++j)
while(j!=-1&&min(b[i],j+1)!=min(b[j],j+1)) j=fail[j];
for(int i=0,j=0;i<n;i++,j++){
if(j==m) return printf("%d\n",i-m+1),0;
while(j!=-1&&min(a[i],j+1)!=min(b[j],j+1)) j=fail[j];
}
}