题面:cf533f
简要题意:有A串和B串,两个串被判为相似的条件是满足在若干(或者没有)二元组 (x, y)表示将串中的所有x换成y,y换成x(x,y代表某个字母)之后,两个串相同。问有多少A的子串与B相似
一开始想到KMP,但是KMP的话时间复杂度显然不对,那么就想到hash
我们把A串中每一个字母在A串中的位置下标做hash,举个例子,某串形如:abaacba
那么对于字母a,我们把a出现的位置下标的值赋为1,其他赋为0,字符串就变成了:1011001, 那么我们对这个串做字符串hash就得到了a的hash值,其他字母同理
然后开始匹配。我们枚举A串的子串开头位置,然后把这段子串的所有字母的hash值都给取出来(字符串hash差分),然后找到26个字母在这个子串中第一次出现的位置(没出现的就不用管了),与B串进行比较就能知道A串中某一字母在B串中对应的字母了,这样构造出二元组之后把A串中这个字母的hash值乘上对应的字母就行了(hash满足分配律)
最后呢我们只要比较一下两者的hash值是不是一样的就好了,如果不一样说明产生了冲突。时间复杂度
O(n∗26)
#include <cstdio>
#include <algorithm>
#include <cmath>
#include <cstring>
#include <iostream>
#include <ctime>
#include <map>
#include <queue>
#include <cstdlib>
#include <string>
#include <climits>
#include <set>
#include <vector>
#define int long long
using namespace std;
const int ba=233;
inline int read(){
int k=0,f=1;char ch=getchar();
while(ch<'0'||ch>'9'){if(ch=='-')f=-1;ch=getchar();}
while(ch>='0'&&ch<='9'){k=k*10+ch-'0';ch=getchar();}
return k*f;
}
int b[30],bin[200010];
int n,m,ans=0,ha1,ha2,s[200010];
int nex[200010][27],ha[200010][27];
char c1[200010],c2[200010];
signed main()
{
n=read();m=read();bin[0]=1;
scanf("%s",c1+1);scanf("%s",c2+1);
for(int i=1;i<=n;i++)bin[i]=bin[i-1]*ba;
for(int i=1;i<=m;i++)ha2=ha2*ba+c2[i]-'a'+1;
for(int i=1;i<=26;i++)nex[n+1][i]=n+1;
for(int i=n;i;i--)
for(int j=1;j<=26;j++)nex[i][j]=(c1[i]==j+'a'-1)?i:nex[i+1][j];
for(int i=1;i<=n;i++)
for(int j=1;j<=26;j++)ha[i][j]=ha[i-1][j]*ba+(c1[i]=='a'+j-1);
for(int i=1;i<=n-m+1;i++){
ha1=0;memset(b,0,sizeof b);
for(int j=1;j<=26;j++)if(nex[i][j]<=i+m-1){
int p=c2[nex[i][j]-i+1]-'a'+1;
if(!b[p]&&!b[j])b[p]=j,b[j]=p;
ha1+=b[j]*(ha[i+m-1][j]-ha[i-1][j]*bin[m]);
}
if(ha1==ha2)s[++ans]=i;
}
printf("%lld\n",ans);
for(int i=1;i<=ans;i++)printf("%d ",s[i]);
return 0;
}