P4173 残缺的字符串(NTT字符串匹配模板)

最新推荐文章于 2021-03-22 10:46:30 发布

weixin_51280132

最新推荐文章于 2021-03-22 10:46:30 发布

阅读量233

点赞数

本文链接：https://blog.csdn.net/weixin_51280132/article/details/113060893

版权

传送门

考虑如何用多项式乘法匹配字符串

设 $s$ 串长 $n$ , $t$ 串长 $m$ ,下标从零开始

把字母转化为 $[1, 26]$ 的数字,数组分别为 $f, g$

定义 $a n s [x] = 0$ 表示 $s$ 串的 $[x, x + m - 1]$ 和 $t$ 串匹配

那么如果 $ans[x]=\sum\limits_{i=0}^{m-1}(f[x+i]-g[i])=0$ 说明是匹配的

等等!!不太对!!

因为这样 $a b$ 和 $b a$ 也是相互匹配的,因为正负抵消变成了零

为了消除正负号的影响,我们平方一下

$ans[x]=\sum\limits_{i=0}^{m-1}(f[x+i]-g[i])^2$

$=\sum\limits_{i=0}^{m-1}f[x+i]^2+\sum\limits_{i=0}^{m-1}g[i]^2-2\sum\limits_{i=0}^{m-1}f[x+i]*g[i]$

第一项可以前缀和预处理,第二项是常数直接暴力，第三项似乎是一个卷积的形式

我们把 $g$ 反转记作 $G [i] = g [m - 1 - i]$

那么 $\sum\limits_{i=0}^{m-1}f[x+i]*G[m-1-i]$

发现 $(x + i) + (m - 1 - i) = m - 1 + x$ 是定值

令 $e = m + x - 1$

所以可以改写成 $\sum\limits_{i=0}^{e}f[i]*G[e-i]$

所以可以得出

$ans[x]=\sum\limits_{i=0}^{m-1}g[i]^2+\sum\limits_{i=0}^{m-1}f[x+i]^2+A[x+m-1]$

其中 $A [i]$ 是卷积的第 $i$ 项

回到这题,因为有通配符的存在,所以我们需要给匹配规则改一下

也就是令通配符位置为 $0$

$ans[x]=\sum\limits_{i=0}^{m-1}(f[x+i]-g[i])^2*f[x+i]*g[i]$

展开可以得到

$ans[x]=\sum\limits_{i=0}^{m-1}f[x+i]^3*g[i]+\sum\limits_{i=0}^{m-1}g[i]^3*f[x+i]-2\sum\limits_{i=0}^{m-1}g_i^2f[x+i]^2$

我们还是令 $G [i] = g [m - 1 - i]$

$ans[x]=\sum\limits_{i=0}^{m-1}f[x+i]^3*G[m-1-i]+\sum\limits_{i=0}^{m-1}G[m-1 -i]^3*f[x+i]-2\sum\limits_{i=0}^{m-1}G[m-1-i]^2f[x+i]^2$

我们令 $e = m - 1 + x$

$ans[x]=\sum\limits_{i=0}^{e}f[i]^3*G[e-i]+\sum\limits_{i=0}^{e}G[e-i]^3*f[i]-2\sum\limits_{i=0}^{e}G[e-i]^2f[i]^2$

所以 $a n s [x]$ 就是所有卷积的第 $m - 1 + x$ 项

于是可以写出下面的代码

#include <bits/stdc++.h>
using namespace std;
const int maxn = 9e6+10;
const int mod =  998244353,G=3,GI = 332748118;
int r[maxn],f[maxn],g[maxn],ans[maxn],n,m;
char s[maxn],t[maxn];
int quick(int x,int n)
{
	int ans = 1;
	for( ; n ; n>>=1,x=1ll*x*x%mod )
		if( n&1 )	ans = 1ll*ans*x%mod;
	return ans;
}
void NTT(int *a,int limit,int type)
{
	for(int i=0;i<limit;i++)	if( i<r[i] )	swap(a[i],a[r[i]]);
	for(int mid = 1;mid<limit;mid<<=1)
	{
		int wn = quick( (type==1)?G:GI,(mod-1)/(mid<<1));
		for(int R=mid<<1,i=0;i<limit;i+=R)
		for(int k=0,w=1;k<mid;k++,w=1ll*w*wn%mod)
		{
			int x = a[i+k], y = 1ll*w*a[i+k+mid]%mod;
			a[i+k] = (1ll*x+y)%mod, a[i+k+mid] = (1ll*x-y+mod)%mod;
		}
	}
	if( type==1 )	return;
	int inv = quick(limit,mod-2);
	for(int i=0;i<limit;i++)	a[i] = 1ll*a[i]*inv%mod;
}
void mul(int *a,int *b,int n,int m)
{
	int limit = 1;
	while( limit<=n+m )	limit<<=1;
	for(int i=0;i<limit;i++)	r[i] = ( r[i>>1]>>1 ) | ( (i&1)?limit>>1:0 );
	for(int i=0;i<limit;i++)
	{
		if( i>=n )	a[i] = 0;
		if( i>=m )	b[i] = 0;
	}
	NTT(a,limit,1); NTT(b,limit,1);
	for(int i=0;i<limit;i++)	a[i] = 1ll*a[i]*b[i]%mod;
	NTT(a,limit,-1);
}
vector<int>vec;
signed main()
{
	scanf("%d%d",&m,&n);
	scanf("%s%s",t,s);
	reverse(t,t+m );
	int limit = 1;
	while( limit<=n+m )	limit<<=1;
	for(int i=0;i<n;i++)	f[i] = s[i]=='*'?0:pow(s[i]-'0',3);
	for(int i=0;i<m;i++)	g[i] = t[i]=='*'?0:pow(t[i]-'0',1);
	mul(f,g,n,m);
	for(int i=0;i<limit;i++)	ans[i] = ( 1ll*ans[i]+f[i+m-1] )%mod;
	for(int i=0;i<n;i++)	f[i] = s[i]=='*'?0:pow(s[i]-'0',1);
	for(int i=0;i<m;i++)	g[i] = t[i]=='*'?0:pow(t[i]-'0',3);
	mul(f,g,n,m);
	for(int i=0;i<limit;i++)	ans[i] = ( 1ll*ans[i]+f[i+m-1] )%mod;
	for(int i=0;i<n;i++)	f[i] = s[i]=='*'?0:pow(s[i]-'0',2);
	for(int i=0;i<m;i++)	g[i] = t[i]=='*'?0:pow(t[i]-'0',2);
	mul(f,g,n,m);		
	for(int i=0;i<limit;i++)	ans[i] = ( 1ll*ans[i]-2*f[i+m-1] )%mod;
	for(int i=0;i<=n-m;i++)
		if( ans[i]==0 )	vec.push_back(i+1);
	printf("%d\n",vec.size() );
	for(int i=0;i<vec.size();i++)
		printf("%d ",vec[i] );
}

但是 $T$ 了…

无奈,只能一直把正变换累加到 $a n s$ 去,然后一次性做掉逆变换, $A C$

#include <bits/stdc++.h>
using namespace std;
const int maxn = 6e6+10;
const int mod =  998244353,G=3,GI = 332748118;
int r[maxn],f[maxn],g[maxn],ans[maxn],n,m;
char s[maxn],t[maxn];
int quick(int x,int n)
{
	int ans = 1;
	for( ; n ; n>>=1,x=1ll*x*x%mod )
		if( n&1 )	ans = 1ll*ans*x%mod;
	return ans;
}
void NTT(int *a,int limit,int type)
{
	for(int i=0;i<limit;i++)	if( i<r[i] )	swap(a[i],a[r[i]]);
	for(int mid = 1;mid<limit;mid<<=1)
	{
		int wn = quick( (type==1)?G:GI,(mod-1)/(mid<<1));
		for(int R=mid<<1,i=0;i<limit;i+=R)
		for(int k=0,w=1;k<mid;k++,w=1ll*w*wn%mod)
		{
			int x = a[i+k], y = 1ll*w*a[i+k+mid]%mod;
			a[i+k] = (1ll*x+y)%mod, a[i+k+mid] = (1ll*x-y+mod)%mod;
		}
	}
	if( type==1 )	return;
	int inv = quick(limit,mod-2);
	for(int i=0;i<limit;i++)	a[i] = 1ll*a[i]*inv%mod;
}
void mul(int *a,int *b,int n,int m)
{
	int limit = 1;
	while( limit<=n+m )	limit<<=1;
	for(int i=0;i<limit;i++)	r[i] = ( r[i>>1]>>1 ) | ( (i&1)?limit>>1:0 );
	for(int i=0;i<limit;i++)
	{
		if( i>=n )	a[i] = 0;
		if( i>=m )	b[i] = 0;
	}
	NTT(a,limit,1); NTT(b,limit,1);
	for(int i=0;i<limit;i++)	a[i] = 1ll*a[i]*b[i]%mod;
}
vector<int>vec;
signed main()
{
	scanf("%d%d",&m,&n);
	scanf("%s%s",t,s);
	reverse(t,t+m );
	int limit = 1;
	while( limit<=n+m )	limit<<=1;
	for(int i=0;i<n;i++)	f[i] = s[i]=='*'?0:pow(s[i]-'0',3);
	for(int i=0;i<m;i++)	g[i] = t[i]=='*'?0:pow(t[i]-'0',1);
	mul(f,g,n,m);
	for(int i=0;i<limit;i++)	ans[i] = ( 1ll*ans[i]+f[i] )%mod;
	for(int i=0;i<n;i++)	f[i] = s[i]=='*'?0:pow(s[i]-'0',1);
	for(int i=0;i<m;i++)	g[i] = t[i]=='*'?0:pow(t[i]-'0',3);
	mul(f,g,n,m);
	for(int i=0;i<limit;i++)	ans[i] = ( 1ll*ans[i]+f[i] )%mod;
	for(int i=0;i<n;i++)	f[i] = s[i]=='*'?0:pow(s[i]-'0',2);
	for(int i=0;i<m;i++)	g[i] = t[i]=='*'?0:pow(t[i]-'0',2);
	mul(f,g,n,m);		
	for(int i=0;i<limit;i++)	ans[i] = ( 1ll*ans[i]-2*f[i] )%mod;
	NTT(ans,limit,-1);
	for(int i=0;i<=n-m;i++)
		if( ans[i+m-1]==0 )	vec.push_back(i+1);
	printf("%d\n",vec.size() );
	for(int i=0;i<vec.size();i++)
		printf("%d ",vec[i] );
}