poj2778 DNA Sequence
题意:求仅有A G C T不含有k(k<=10)个长度为d(d<=10)串的长度为L(L<=2*10^9)的串有多少个%100000
题解:
做完感觉之前对AC自动机理解的还不够透彻。
做完就透彻了?也不一定。
首先 bzoj上有一道和这个差不多 不过是kmp而不是AC自动机
bzoj1009 题解:http://www.cnblogs.com/BLADEVIL/p/3483694.html
讲的很透彻。。
然后这道题 dp[i,j]表示母串前i个匹配到trie树的j号节点的个数
对于每个i dp[i,j]加上A G C T分别可以转移到dp[i+1,x],x是由AC自动机推出的
注意 其他节点可以转移到危险节点 危险节点不能转移到其他节点
危险节点包括什么呢?
比如子串有abcddd和abc
那么前一个串的c也是危险节点。(我tm错这卡一晚上)
发现这个错误 也反映了我对AC自动机的一些没有引起注意的概念
AC自动机 每走到一个节点i 代表找到了i以及f[i]以及f[f[i]]等等……
每个j能转移到x ori.a[x,j]++;最后得出个矩阵 快速幂就好了
#include<iostream>
#include<cstdio>
#include<cstdlib>
#include<queue>
#define ll long long
using namespace std;
const int L=15,N=105,Mo=100000;
struct M{
ll a[N][N];
}ori,res,tmp;
int f[N],val[N],ch[N][4],sz;
queue<int>q;
void init(){
memset(f,0,sizeof(f));
memset(val,0,sizeof(val));
memset(ch,0,sizeof(ch));
sz=0;
}
int idx(char c){
if(c=='A') return 0;
if(c=='G') return 1;
if(c=='C') return 2;
if(c=='T') return 3;
}
void insert(char *s){
int u=0;
for(int i=0;s[i];i++){
int c=idx(s[i]);
if(!ch[u][c]) ch[u][c]=++sz;
u=ch[u][c];
}
val[u]=1;
}
void getfail(){
for(int i=0;i<4;i++) if(ch[0][i]) q.push(ch[0][i]);
while(!q.empty()){
int r=q.front();q.pop();
for(int i=0;i<4;i++){
int u=ch[r][i];
if(!u) {ch[r][i]=ch[f[r]][i];continue;}
q.push(u);
int v=f[r];
while(v && !ch[v][i]) v=f[v];
f[u]=ch[v][i];
if(val[f[u]]) val[u]=1;
}
}
}
M mul(M x,M y){
memset(tmp.a,0,sizeof(tmp.a));
for(int i=0;i<=sz;i++)
for(int j=0;j<=sz;j++)
for(int k=0;k<=sz;k++){
tmp.a[i][j]+=(ll)x.a[i][k]*(ll)y.a[k][j];
tmp.a[i][j]%=Mo;
}
return tmp;
}
void ksm(int k){
for(int i=0;i<=sz;i++) res.a[i][i]=1;
while(k){
if(k&1)
res=mul(ori,res);
ori=mul(ori,ori);
k>>=1;
}
}
char s[L];int n,m;
ll ans,d[N];
int main(){
freopen("in.txt","r",stdin);
freopen("out.txt","w",stdout);
scanf("%d%d\n",&n,&m);
init();
for(int i=1;i<=n;i++) scanf("%s",s),insert(s);
getfail();
for(int i=0;i<=sz;i++)
if(!val[i])
for(int j=0;j<4;j++)
ori.a[ch[i][j]][i]++;
ksm(m-1);
for(int i=0;i<4;i++) d[ch[0][i]]++;
for(int i=0;i<=sz;i++)
if(!val[i]){
for(int j=0;j<=sz;j++){
ans+=(ll)d[j]*(ll)res.a[i][j];
ans%=Mo;
}
//printf("%lld\n",ans);
}
printf("%lld\n",ans);
}