题面
题意
给出至多10个由A,G,T,C组成的字符串,问长度为n(n<=2e9),由A,G,T,C组成的且不包含之前给的几个字符串的字符串有几个.
做法
因为是多个字符串的匹配问题,首先建出AC自动机,若n比较小则可以在自动机上dp,但因为n很大,而且给出的字符串又短又少,故可以用矩阵快速幂.
首先找出自动机上的所有合法节点(不包含给出字符串的节点),然后统计出它们后面加一个字符能够到达的节点及个数,保存在一个矩阵里,这个矩阵的m次就表示,所有节点后面加上m个字符后到达的节点及其个数,根节点所在的那行之和即为答案.
代码
#include<iostream>
#include<cstdio>
#include<cstring>
#include<queue>
#define ll long long
#define M 100000
using namespace std;
ll n,m,tt,zh[128],l,an,jl[110];
char str[20];
struct Node
{
ll son[4],fail;
bool ban;
}node[110];
struct Jz
{
ll num[100][100];
Jz()
{
memset(num,0,sizeof(num));
}
Jz operator * (const Jz &u) const
{
Jz res;
ll i,j,k;
for(i=1;i<=l;i++)
{
for(j=1;j<=l;j++)
{
for(k=1;k<=l;k++)
{
res.num[i][j]=(res.num[i][j]+num[i][k]*u.num[k][j]%M)%M;
}
}
}
return res;
}
}dw,ans;
queue<ll>que;
inline void add()
{
ll i,j,t,u,now=0;
for(i=1,t=strlen(str+1);i<=t;i++)
{
u=zh[str[i]];
if(!node[now].son[u])
{
node[now].son[u]=++tt;
}
now=node[now].son[u];
}
node[now].ban=1;
}
inline void build()
{
ll i,j,k,p,q,u;
for(i=0;i<4;i++)
{
if(!node[0].son[i]) continue;
node[node[0].son[i]].fail=0;
que.push(node[0].son[i]);
}
for(;!que.empty();)
{
q=que.front();
que.pop();
for(i=0;i<4;i++)
{
if(!node[q].son[i]) continue;
for(k=node[q].fail;k&&!node[k].son[i];k=node[k].fail);
node[node[q].son[i]].fail=node[k].son[i];
node[node[q].son[i]].ban|=node[node[k].son[i]].ban;
que.push(node[q].son[i]);
}
}
}
inline ll gt(ll u,ll v)
{
ll res;
for(res=u;res&&!node[res].son[v];res=node[res].fail);
return node[res].son[v];
}
inline Jz po(Jz u,ll v)
{
Jz res;
ll i,j;
for(i=1;i<=l;i++) res.num[i][i]=1;
for(;v;)
{
if(v&1) res=res*u;
u=u*u;
v>>=1;
}
return res;
}
int main()
{
ll i,j,k,t;
zh['A']=0,zh['C']=1,zh['T']=2,zh['G']=3;
cin>>n>>m;
for(i=1;i<=n;i++)
{
scanf("%s",str+1);
add();
}
build();
for(i=0;i<=tt;i++)
{
if(node[i].ban) continue;
jl[i]=++l;
}
for(i=k=0;i<=tt;i++)
{
if(node[i].ban) continue;
k++;
for(j=0;j<4;j++)
{
t=gt(i,j);
if(node[t].ban) continue;
dw.num[k][jl[t]]++;
}
}
ans=po(dw,m);
for(i=1;i<=l;i++)
{
an=(an+ans.num[1][i])%M;
}
cout<<an;
}