POJ 2778 DNA Sequence

刚开始学习AC自动机,碰到这道题,揣摩了好一会儿才弄清楚题解的意思orz

题目要求找出由A,C,T,G构成的长度为n,且不包含给出的子串的字符串数量。

先建trie树。发现如果对符合题意答案串进行AC自动机处理,处理过程中的指针一定不会碰到给出的子串的末节点。所以只要考虑指针在匹配过程中,在trie树上正确地跳来跳去的方案数。用一个矩阵mat[i][j],记下从i节点转移一次到达j节点的方案数。

使不能到达的节点,即给出的子串的末节点不统计进mat矩阵。那么最终答案就是mat矩阵的n方。

有一些重要的细节,
root的fail要指向root自己
无效的next要指向root

#include<cstdio>
#include<queue>
#include<cstring>
#define MOD 100000
using namespace std;
char s[15];
int cnt=-1;
int hash(char ch)
{
    switch(ch)
    {
        case 'A': return 0;
        case 'C': return 1;
        case 'T': return 2;
        case 'G': return 3;
    }
    return 233;
}
struct matrix
{
    long long mat[105][105];
    matrix(){memset(mat,0,sizeof(mat));}
    matrix operator * (matrix x)
    {
        matrix r;
        for(int i = 0; i <= cnt; i++)
            for(int j = 0; j <= cnt; j++)
                for(int k = 0; k <= cnt; k++)
                    r.mat[i][j]=(r.mat[i][j]+mat[i][k]*x.mat[k][j])%MOD;
        return r;
    }
}mat,matt;
struct node
{
    node *fail, *next[5];
    bool flag;
    int id;
    node()
    {
        fail=NULL;
        memset(next,NULL,sizeof(next));
        flag=0;
        id=++cnt;
    }
};
struct ACAutomaton
{
    node *root, *id[105];

    void init()
    {
        root=new node;
        id[0]=root;
    }
    void insert(char *s)
    {
        node *p=root;
        for(int i = 0; s[i]; i++)
        {
            int c=hash(s[i]);
            if(p->next[c]==NULL)
            {
                p->next[c]=new node;
                id[cnt]=p->next[c];
            }
            p=p->next[c];
        }
        p->flag=true;
    }
    void build()
    {
        queue<node*> q;
        for(int i = 0; i < 4; i++)
        {
            if(root->next[i])
            {
                q.push(root->next[i]);
                root->next[i]->fail=root;
            }
            else
                root->next[i]=root;
        }
        while(!q.empty())
        {
            root->fail=root;
            node *u = q.front();
            q.pop();
            for(int i = 0; i < 4; i++)
            {
                if(u->next[i])
                {
                    q.push(u->next[i]);
                    node *t=u->fail;
                    while(t!=root && t->next[i]==NULL)
                        t=t->fail;
                    if(t->next[i])
                    {
                        u->next[i]->flag |= t->next[i]->flag;
                        u->next[i]->fail = t->next[i]; 
                    }
                    else u->next[i]->fail=root;
                }
                else u->next[i]=u->fail->next[i];
            }
        }
    }
    void matrix()
    {
        for(int i = 0; i <= cnt; i++)
        { 
            node *u=id[i];
            if(u->flag)continue;
            for(int j = 0; j < 4; j++)
            {
                if(u->next[j]==NULL || u->next[j]->flag)continue;
                mat.mat[i][u->next[j]->id]++;
            }
        } 
    }
}AC;
void matrix_power(int n)
{
    for(int i = 0; i <= cnt; i++)
        matt.mat[i][i]=1;
    for(;n;n>>=1)
    {
        if(n&1)
            matt=matt*mat;
        mat=mat*mat;
    }
}
int main()
{   

    int m, n;
    scanf("%d%d",&m,&n);
    AC.init();
    for(int i = 1; i <= m; i++)
    {
        scanf("%s",s);
        AC.insert(s);
    }
    AC.build();
    AC.matrix();
    matrix_power(n);
    int ans=0;
    for(int i = 0; i <= cnt; i++)
    {
        ans+=matt.mat[0][i]; 
        ans%=MOD;
    }
    printf("%d\n",ans);
    return 0; 
}
深度学习是机器学习的一个子领域,它基于人工神经网络的研究,特别是利用多层次的神经网络来进行学习和模式识别。深度学习模型能够学习数据的高层次特征,这些特征对于图像和语音识别、自然语言处理、医学图像分析等应用至关重要。以下是深度学习的一些关键概念和组成部分: 1. **神经网络(Neural Networks)**:深度学习的基础是人工神经网络,它是由多个层组成的网络结构,包括输入层、隐藏层和输出层。每个层由多个神经元组成,神经元之间通过权重连接。 2. **前馈神经网络(Feedforward Neural Networks)**:这是最常见的神经网络类型,信息从输入层流向隐藏层,最终到达输出层。 3. **卷积神经网络(Convolutional Neural Networks, CNNs)**:这种网络特别适合处理具有网格结构的数据,如图像。它们使用卷积层来提取图像的特征。 4. **循环神经网络(Recurrent Neural Networks, RNNs)**:这种网络能够处理序列数据,如时间序列或自然语言,因为它们具有记忆功能,能够捕捉数据中的时间依赖性。 5. **长短期记忆网络(Long Short-Term Memory, LSTM)**:LSTM 是一种特殊的 RNN,它能够学习长期依赖关系,非常适合复杂的序列预测任务。 6. **生成对抗网络(Generative Adversarial Networks, GANs)**:由两个网络组成,一个生成器和一个判别器,它们相互竞争,生成器生成数据,判别器评估数据的真实性。 7. **深度学习框架**:如 TensorFlow、Keras、PyTorch 等,这些框架提供了构建、训练和部署深度学习模型的工具和库。 8. **激活函数(Activation Functions)**:如 ReLU、Sigmoid、Tanh 等,它们在神经网络中用于添加非线性,使得网络能够学习复杂的函数。 9. **损失函数(Loss Functions)**:用于评估模型的预测与真实值之间的差异,常见的损失函数包括均方误差(MSE)、交叉熵(Cross-Entropy)等。 10. **优化算法(Optimization Algorithms)**:如梯度下降(Gradient Descent)、随机梯度下降(SGD)、Adam 等,用于更新网络权重,以最小化损失函数。 11. **正则化(Regularization)**:技术如 Dropout、L1/L2 正则化等,用于防止模型过拟合。 12. **迁移学习(Transfer Learning)**:利用在一个任务上训练好的模型来提高另一个相关任务的性能。 深度学习在许多领域都取得了显著的成就,但它也面临着一些挑战,如对大量数据的依赖、模型的解释性差、计算资源消耗大等。研究人员正在不断探索新的方法来解决这些问题。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值