字符串hash——Codeforces533F Encoding

最新推荐文章于 2022-10-30 23:11:24 发布

jzq233jzq

最新推荐文章于 2022-10-30 23:11:24 发布

阅读量491

点赞数 2

分类专栏： KMP/字符串hash 文章标签： codeforces hash

本文链接：https://blog.csdn.net/jzq233jzq/article/details/78277735

版权

KMP/字符串hash 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

题面：cf533f
简要题意：有A串和B串，两个串被判为相似的条件是满足在若干（或者没有）二元组 (x, y)表示将串中的所有x换成y，y换成x（x，y代表某个字母）之后，两个串相同。问有多少A的子串与B相似

一开始想到KMP，但是KMP的话时间复杂度显然不对，那么就想到hash
我们把A串中每一个字母在A串中的位置下标做hash，举个例子，某串形如：abaacba
那么对于字母a，我们把a出现的位置下标的值赋为1，其他赋为0，字符串就变成了：1011001，那么我们对这个串做字符串hash就得到了a的hash值，其他字母同理
然后开始匹配。我们枚举A串的子串开头位置，然后把这段子串的所有字母的hash值都给取出来（字符串hash差分），然后找到26个字母在这个子串中第一次出现的位置（没出现的就不用管了），与B串进行比较就能知道A串中某一字母在B串中对应的字母了，这样构造出二元组之后把A串中这个字母的hash值乘上对应的字母就行了（hash满足分配律）
最后呢我们只要比较一下两者的hash值是不是一样的就好了，如果不一样说明产生了冲突。时间复杂度 $O(n*26)$

#include <cstdio>
#include <algorithm>
#include <cmath>
#include <cstring>
#include <iostream>
#include <ctime>
#include <map>
#include <queue>
#include <cstdlib>
#include <string>
#include <climits>
#include <set>
#include <vector>
#define int long long
using namespace std;
const int ba=233;
inline int read(){
    int k=0,f=1;char ch=getchar();
    while(ch<'0'||ch>'9'){if(ch=='-')f=-1;ch=getchar();}
    while(ch>='0'&&ch<='9'){k=k*10+ch-'0';ch=getchar();}
    return k*f;
}
int b[30],bin[200010];
int n,m,ans=0,ha1,ha2,s[200010];
int nex[200010][27],ha[200010][27];
char c1[200010],c2[200010];
signed main()
{
    n=read();m=read();bin[0]=1;
    scanf("%s",c1+1);scanf("%s",c2+1);
    for(int i=1;i<=n;i++)bin[i]=bin[i-1]*ba;
    for(int i=1;i<=m;i++)ha2=ha2*ba+c2[i]-'a'+1;
    for(int i=1;i<=26;i++)nex[n+1][i]=n+1;
    for(int i=n;i;i--)
        for(int j=1;j<=26;j++)nex[i][j]=(c1[i]==j+'a'-1)?i:nex[i+1][j];
    for(int i=1;i<=n;i++)
        for(int j=1;j<=26;j++)ha[i][j]=ha[i-1][j]*ba+(c1[i]=='a'+j-1);
    for(int i=1;i<=n-m+1;i++){
        ha1=0;memset(b,0,sizeof b);
        for(int j=1;j<=26;j++)if(nex[i][j]<=i+m-1){
            int p=c2[nex[i][j]-i+1]-'a'+1;
            if(!b[p]&&!b[j])b[p]=j,b[j]=p;
            ha1+=b[j]*(ha[i+m-1][j]-ha[i-1][j]*bin[m]);
        }
        if(ha1==ha2)s[++ans]=i;
    }
    printf("%lld\n",ans);
    for(int i=1;i<=ans;i++)printf("%d ",s[i]);
    return 0;
}

jzq233jzq

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
字符串hash——Codeforces533F Encoding

题面：cf533f 简要题意：有A串和B串，两个串被判为相似的条件是满足在多个二元组 (x, y)表示将串中的所有x换成y，y换成x（x，y代表某个字母）之后，两个串相同。问有多少A的子串与B相似一开始想到KMP，但是KMP的话时间复杂度显然不对，那么就想到hash 我们把A串中每一个字母在A串中的位置下标做hash，举个例子，某串形如：abaacba 那么对于字母a，我们把a出现的位置下标的
复制链接

扫一扫

专栏目录