Description
很久很久以前,在你刚刚学习字符串匹配的时候,有两个仅包含小写字母的字符串A和B,其中A串长度为m,B串长度为n。可当你现在再次碰到这两个串时,这两个串已经老化了,每个串都有不同程度的残缺。
你想对这两个串重新进行匹配,其中A为模板串,那么现在问题来了,请回答,对于B的每一个位置i,从这个位置开始连续m个字符形成的子串是否可能与A串完全匹配?
Input
第一行包含两个正整数m,n(1<=m<=n<=300000),分别表示A串和B串的长度。
第二行为一个长度为m的字符串A。
第三行为一个长度为n的字符串B。
两个串均仅由小写字母和*号组成,其中*号表示相应位置已经残缺。
Output
第一行包含一个整数k,表示B串中可以完全匹配A串的位置个数。
若k>0,则第二行输出k个正整数,从小到大依次输出每个可以匹配的开头位置(下标从1开始)。
题解:
构造多项式 $C$,设 $C_{j}=\sum_{i=0}^{m-1}(A{i}-B_{i+j})^2\times A_{i}\times B{i+j}$.
不难发现,如果 $C_{i}=0$,则 $B_{j}$ 开始的一段长度为 $m$ 的字符串会与 $A$ 串对应完全相等.
将式子展开,得 $C_{j}=\sum_{i=0}^{m-1}B_{i+j}^{3}+A_{i}^{3}B_{i+j}-2A_{i}^{2}B_{i+j}^{2}$.
将 $A$ 下标反转,来三次 FFT,最终加和即可.
#include<bits/stdc++.h>
#define maxn 1200000
using namespace std;
void setIO(string s)
{
string in=s+".in", out=s+".out";
freopen(in.c_str(),"r",stdin);
freopen(out.c_str(),"w",stdout);
}
#define pi 3.1415926535898
struct cpx
{
double x,y;
cpx(double a=0,double b=0){x=a,y=b;}
cpx operator+(const cpx b){ return cpx(x+b.x,y+b.y); }
cpx operator-(const cpx b){ return cpx(x-b.x,y-b.y); }
cpx operator*(const cpx b){ return cpx(x*b.x-y*b.y,x*b.y+y*b.x); }
}a1[maxn],a2[maxn],a3[maxn],b1[maxn],b2[maxn],b3[maxn];
void FFT(cpx *a,int n,int flag)
{
for(int i=0,k=0;i<n;++i)
{
if(i>k) swap(a[i],a[k]);
for(int j=n>>1;(k^=j)<j;j>>=1);
}
for(int mid=1;mid<n;mid<<=1)
{
cpx wn(cos(pi/mid), flag*sin(pi/mid)),x,y;
for(int j=0;j<n;j+=(mid<<1))
{
cpx w(1,0);
for(int k=0;k<mid;++k)
{
x=a[j+k],y=w*a[j+mid+k];
a[j+k]=x+y, a[j+k+mid]=x-y;
w=w*wn;
}
}
}
}
char str1[maxn],str2[maxn];
int n,m,len=1;
int arr[maxn],brr[maxn];
queue<int>Q;
int main()
{
// setIO("input");
scanf("%d%d%s%s",&n,&m,str1,str2);
while(len<n+m)len<<=1;
for(int i=0;i<n;++i) arr[n-1-i]=str1[i]=='*'?0.00:(double)str1[i]-'a'+1;
for(int i=0;i<m;++i) brr[i]=str2[i]=='*'?0.00:(double)str2[i]-'a'+1;
for(int i=0;i<n;++i) a1[i]=cpx(arr[i]*arr[i]*arr[i],0),a2[i]=cpx(arr[i],0), a3[i]=cpx(arr[i]*arr[i],0);
for(int i=0;i<m;++i) b1[i]=cpx(brr[i],0), b2[i]=cpx(brr[i]*brr[i]*brr[i],0), b3[i]=cpx(brr[i]*brr[i],0);
FFT(a1,len,1),FFT(a2,len,1),FFT(a3,len,1),FFT(b1,len,1),FFT(b2,len,1),FFT(b3,len,1);
for(int i=0;i<len;++i) a1[i]=a1[i]*b1[i]+a2[i]*b2[i]-a3[i]*b3[i]-a3[i]*b3[i];
FFT(a1,len,-1);
for(int i=0;i+n-1<m;++i) if((int)(a1[i+n-1].x/len+0.1)==0) Q.push(i+1);
printf("%d\n",Q.size());
while(!Q.empty())
{
printf("%d ",Q.front());
Q.pop();
}
return 0;
}