kuangbin 专题十七 POJ2778(经典好题) AC自动机+矩阵快速幂

题意:
给出患病的DNA序列,问序列长度为n的,且不包含患病的DNA序列有多少种。
题解:
这道题我是看别人做出来的,怎么说呢,开拓了视野,也让我知道AC自动还能这样操作,也让我更深入了解了矩阵的强大。
比如A(i,j)表示的是i->j,如果A*A表示的就是i到j要走两步。具体怎么回事可以看看这位博主:
http://blog.csdn.net/wt_cnyali/article/details/69803030

然后听说这道题是Matrix67大神的十大经典矩阵的例题8,有兴趣的朋友可以去看看:
www.matrix67.com/blog/archives/276

还有就是可以看看这位博主的画图和解释:http://blog.csdn.net/morgan_xww/article/details/7834801

做这道题的话要将AC自动机的状态图抽象成点与点之间连接的有向图。所以这道题与普通的AC自动机找fail指针是有点区别的,比如如果你的fail指针指向的地方是病毒序列那么就说明你当前已经匹配的字符串肯定已经带有病毒序列了,所以肯定也要标记为病毒序列,就好像C为病毒序列,你A不是病毒序列,但是你A匹配了C的话就变成AC,而C是病毒序列,就相当AC变成了病毒序列,需要标记。然后还有另外一步关键的点就是假如你temp没有儿子节点的话就要补充完整,一个图不能缺少点的信息,所以就要连接temp->fail指向的next[i]了,如果连失配指针都没有的话就直接连接root得了,最关键的两个点说了,再看回去看看我最后发的那个博主的图你们应该能看明白了。然后就是建立矩阵,再矩阵快速幂的事情了,做矩阵快速幂最好开LL,因为听说这道题炸int。查看i与j是否为病毒序列,如果两个都不是的话,就连接上两个节点,那么整张图就建立成功了。

#include<stdio.h>
#include<string.h>
#include<queue>
#include<algorithm>
using namespace std;
#define LL long long int
const int mod=100000;
struct Trie
{
    bool flag;
    int id;
    Trie *fail;
    Trie *next[4];
    Trie(){
        id=0;
        flag=false;
        fail=0;
        for(int i=0;i<4;i++)
        next[i]=0;
    }
}*root;
struct node
{
    LL m[105][105];
    node(){
        memset(m,0,sizeof(m));
    }
};
Trie *dfn[105];//存放Trie树的节点地址。 
int tot;//tot一开始等于1是因为root的id为0. 
int check(char c)
{
    if(c=='A') return 0;
    else if(c=='G') return 1;
    else if(c=='T') return 2;
    else return 3;
}
void insert(char *s)
{
    Trie *r=root;
    for(int i=0;s[i];i++)
    {
        int x=check(s[i]);
        if(r->next[x]==0)
        {
            r->next[x]=new(Trie);
            r=r->next[x];
            r->id=tot;
            dfn[tot++]=r;
        }
        else
        r=r->next[x];
    }
    r->flag=true;
}
void getfail()//这里要改点东西
{
    queue<Trie *>q;
    q.push(root);
    Trie *p;
    Trie *temp;
    while(!q.empty())
    {
        temp=q.front();
        q.pop();
        for(int i=0;i<4;i++)
        {
            if(temp->next[i])
            {
                if(temp==root)
                {
                    temp->next[i]->fail=root;
                }
                else
                {
                    p=temp->fail;
                    while(p)
                    {
                        if(p->next[i])
                        {
                            temp->next[i]->fail=p->next[i];
                            break;
                        }
                        p=p->fail;
                    }
                    if(p==0)
                    temp->next[i]->fail=root;
                }
                if(temp->next[i]->fail->flag)//儿子是危险串时,自己也应该为危险串,就相当于C是危险字符串,AC中A不是危险的,但是匹配了C成为了危险的。 
                temp->next[i]->flag=true;
                q.push(temp->next[i]);
            }
            else//这一步也是关键,相当于把空的节点补充完整,使每个子串都有儿子
            {
                if(temp->fail) temp->next[i]=temp->fail->next[i];
                else temp->next[i]=root;
            } 
        }
    }
}
node getMatrix()
{
    node A;
    for(int i=0;i<tot;i++)
    {
        for(int j=0;j<4;j++)
        if(!dfn[i]->flag&&!dfn[i]->next[j]->flag){
            A.m[dfn[i]->id][dfn[i]->next[j]->id]++;
            A.m[dfn[i]->id][dfn[i]->next[j]->id]%=mod;
        }
    }
    return A;
}
node cla(node A,node B)
{
    node C;
    for(int i=0;i<tot;i++)
        for(int j=0;j<tot;j++)
            for(int k=0;k<tot;k++)
            if(A.m[i][k]&&B.m[k][j])
            {
                C.m[i][j]+=A.m[i][k]*B.m[k][j];
                C.m[i][j]%=mod;
//              printf("%d %d %d\n",C.m[i][j],A.m[i][k],B.m[k][j]);
            }
    return C;       
} 
LL POW(node A,int k)
{
    node C;
    for(int i=0;i<tot;i++) C.m[i][i]=1;
    while(k)
    {
        if(k&1) C=cla(C,A);
        A=cla(A,A);
        k>>=1;
    }
    LL ans=0;
    for(int i=0;i<tot;i++)
    ans=(ans+C.m[0][i])%mod;
    return ans;
}
int main()
{
    int n,m;
    while(~scanf("%d%d",&n,&m))
    {
        root=new(Trie);
        tot=0;
        dfn[tot++]=root;
        char s[17];
        for(int i=0;i<n;i++)
        {
            scanf("%s",s);
            insert(s);
        }
        getfail();
        node A=getMatrix();
//      for(int i=0;i<tot;i++)
//      {
//          for(int j=0;j<tot;j++)
//          printf("%d ",A.m[i][j]);
//          printf("\n");
//      }
        LL ans=POW(A,m);
        printf("%d\n",ans);
    }
}
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值