【UVA 11019 Matrix Matcher 】二维Hash+尺取 / 二维AC自动机

最新推荐文章于 2020-03-19 16:01:54 发布

lajiyuan_

最新推荐文章于 2020-03-19 16:01:54 发布

阅读量249

点赞数

分类专栏： UVA Hash AC自动机

本文链接：https://blog.csdn.net/qq_38891827/article/details/80723635

版权

Hash 同时被 3 个专栏收录

11 篇文章 1 订阅

订阅专栏

AC自动机

8 篇文章 0 订阅

订阅专栏

UVA

4 篇文章 0 订阅

订阅专栏

UVA-11019
本体题意就是给你AB两个字符矩阵，问你B矩阵在A矩阵中的出现次数。

Hash解法

我们可以进行二维hash，其实就是把n个横向串连在一起hash。
注意判相等的时候，我们不断进行尺取+hash，尺取的过程，我们删除当前第一行的hash值加上最后一行的hash值，删除第一行的hash值直接删去就可以
例如
$AAA$
$BBB$
$CCC$
我们删去第一行的hash值相当于把矩阵变成了
$000$
$BBB$
$CCC$
此时我们再添加最后一行
$000$
$BBB$
$CCC$
$DDD$
如果这时候的B矩阵是
$BBB$
$CCC$
$DDD$
这两个矩阵的hash值不同的，为了处理这种情况，我们把B矩阵相应的添加前几行
变成
$000$
$BBB$
$CCC$
$DDD$
这样再去匹配就可以了。
以上就是二维hash大概的处理方法（是我自己想的做法，如果有其他好的尺取方法欢迎指教
掌握了这个做法，我们就可以枚举矩阵的左上角，然后对于当前列数的矩阵从上向下进行尺取，hash判断就可以了。
UVA-11019代码

#include<stdio.h>
#include<algorithm>
#include<iostream>
using namespace std;
const int maxn = 1e3+5;
const int MAXN = 1e6+5;
typedef unsigned long long ull;
ull hash_[maxn][maxn],xp[MAXN];
char str[maxn][maxn];
char str2[maxn][maxn];
void init()
{
    xp[0]=1;
    for(int i=1;i<MAXN;i++)
    {
        xp[i]=xp[i-1]*13331;
    }
    return ;
}
ull Get_hash(int i,int j,int l)
{
    return hash_[i][j]-hash_[i][j+l]*xp[l];
}
int main()
{
    init();
    int t;
    scanf("%d",&t);
    while(t--)
    {
        int ans=0;
        int n,m,x,y;
        scanf("%d%d",&n,&m);
        for(int i=0;i<n;i++)
        {
            scanf("%s",str[i]);
        }
        for(int i=0;i<n;i++)
        {
            hash_[i][m]=0;
            for(int j=m-1;j>=0;j--)
            {
                hash_[i][j]=hash_[i][j+1]*13331+str[i][j]-'a'+1;//每一行分别处理hash值
            }
        }
        scanf("%d%d",&x,&y);
        for(int i=0;i<x;i++)
            scanf("%s",str2[i]);
        ull tmp=0;
        for(int i=x-1;i>=0;i--)
        {
            for(int j=y-1;j>=0;j--)
            {
                tmp=tmp*13331+str2[i][j]-'a'+1;//处理出匹配矩阵的hash值
            }
        }
        for(int i=0;i<=m-y;i++)//枚举横坐标起点
        {
            ull tt=tmp;
            ull tmp2=0;
            for(int j=x-1;j>=0;j--)
            {
                tmp2=tmp2*xp[y]+Get_hash(j,i,y);
            }
             if(tt==tmp2) ans++;
             for(int j=x;j<n;j++)
             {
                 tmp2-=Get_hash(j-x,i,y)*xp[(j-x)*y];//尺取过程去除第一行，也就是将第一行变为0
                 tmp2+=Get_hash(j,i,y)*xp[j*y];//加上最后一行
                 tt=tt*xp[y];//将匹配矩阵第一行添上0
                 if(tmp2==tt) ans++;
             }
        }
        printf("%d\n",ans);
    }
    return 0;
}

AC自动机解法

我们用B矩阵的每一行插入Trie树，用A的每一行去跑AC自动机，得到A的每个位置可以匹配B的哪些行，存到一个三维矩阵con[i][j][k]里，con[i][j][k]表示A矩阵第i行第j列的点可匹配B矩阵中的第k行，之后枚举A矩阵起点，然后向下扫x行，检验是否都可以匹配，都可以匹配就更新答案。
注意B中可能存在某些相同行，所以用一个vector进行存储

#include<stdio.h>
#include<algorithm>
#include<iostream>
#include<string.h>
#include<queue>
#include<stdlib.h>
using namespace std;
const int maxn = 5e5+5;
int strl[1005];
int n,m,x,y;
bool con[1005][1005][105];
struct ACTrie
{
    int tree[maxn][26],fail[maxn],end_[maxn];
    int root,cnt;
    vector<int> v[maxn];
    int newnode()
    {
        for(int i=0;i<26;i++)
            tree[cnt][i]=-1;
        end_[cnt++]=0;
        return cnt-1;
    }
    void init()
    {
        cnt=0;
        root=newnode();
    }
    void insert_(char str[],int xpos)
    {
        int len= strlen(str);
        int pos=root;
        for(int i=0;i<len;i++)
        {
            int id=str[i]-'a';
            if(tree[pos][id]==-1)
                tree[pos][id]=newnode();
            pos=tree[pos][id];
        }
        if(end_[pos]==0)
        {
            v[pos].clear();
            end_[pos]=1;
        }
        v[pos].push_back(xpos);//可能B中某些行相同，所以存到一起
    }
    void build()
    {
        queue<int> que;
        fail[root]=root;
        for(int i=0;i<26;i++)
        {
            if(tree[root][i]==-1) tree[root][i]=root;
            else
            {
                fail[tree[root][i]]=root;
                que.push(tree[root][i]);
            }
        }
        while(!que.empty())
        {
            int now=que.front();
            que.pop();
            for(int i=0;i<26;i++)
            {
                if(tree[now][i]==-1)
                    tree[now][i]=tree[fail[now]][i];
                else
                {
                    fail[tree[now][i]]=tree[fail[now]][i];
                    que.push(tree[now][i]);
                }
            }
        }
    }
    void query(char str[],int xpos)
    {
        int len=strlen(str);
        int now=root;
        for(int i=0;i<len;i++)
        {
            now=tree[now][str[i]-'a'];//在Trie上不断向后跑
            int temp=now;
            while(temp!=root)
            {
                if(end_[temp])
                {
                    for(int j=0;j<v[temp].size();j++)
                    {
                        int pp=v[temp][j];
                        con[xpos][i-y+1][pp]=true;//列的起始位置是i-y+1
                    }
                }
                temp=fail[temp];
            }
        }
        return ;
    }
};
char str[maxn*2];
char str1[1005][1005];
ACTrie ac;
int main()
{
    int t;
    scanf("%d",&t);
    while(t--)
    {
        scanf("%d%d",&n,&m);
        for(int i=0;i<n;i++) scanf("%s",str1[i]);
        ac.init();
        scanf("%d%d",&x,&y);
        for(int i=0;i<x;i++)
        {
            scanf("%s",str);
            ac.insert_(str,i);
        }
        ac.build();
        for(int i=0;i<n;i++)
        {
            for(int j=0;j<m;j++)
            {
                for(int k=0;k<x;k++)
                {
                    con[i][j][k]=false;
                }
            }
        }
        for(int i=0;i<n;i++)
        {
            ac.query(str1[i],i);
        }
        int ans=0;
        for(int i=0;i<=n-x;i++)//注意边界
        {
            for(int j=0;j<=m-y;j++)//注意边界
            {
                int flag=0;
                for(int k=i,l=0;k<i+x;k++,l++)
                {
                    if(!con[k][j][l])
                    {
                        flag=1;
                        break;
                    }
                }
                if(flag==0) ans++;//全都匹配
            }
        }
        printf("%d\n",ans);
    }
    return 0;
}