JZOJ 5462. 【NOIP2017提高A组冲刺11.8】好文章

最新推荐文章于 2021-09-03 21:10:32 发布

Felix-Lee

最新推荐文章于 2021-09-03 21:10:32 发布

阅读量414

点赞数 1

分类专栏：字符串 Hash 文章标签：字符串 Hash

本文链接：https://blog.csdn.net/liyizhixl/article/details/78484329

版权

字符串同时被 2 个专栏收录

22 篇文章 0 订阅

订阅专栏

Hash

8 篇文章 0 订阅

订阅专栏

Description

nodgd写了一篇文章，自认为这是一篇好文章。nodgd的文章由n个小写英文字母组成。文章的一个子串指的是文章中的一段连续的字母，子串的长度就是这一段的字母个数。nodgd在文章中用了排比、对偶、前后照应之类的手法，所以就有很多个子串是相同或者相近的。为了向大家证明这是一篇好文章，nodgd决定给自己的文章进行评分。nodgd首先确定了一个整数m，然后统计出文章中有多少个不相同的长度为m的子串，这个数量就是文章的评分。
然而，nodgd懒得老老实实计算这个评分了，就把任务丢给了你。

Input

第一行包含两个整数n,m，表示文章的长度和需要统计的子串长度。
第二行包含一个长度为n的只包含小写字母的字符串。

Output

输出一行一个整数，表示文章的评分。

Sample Input

输入1：

5 3
aaaab

输入2：

9 3
abcabacba

Sample Output

输出1：

样例解释1：

长度为3的子串有3个，分别是aaa,aaa,aab，其中不同的只有2个。

输出2：

样例解释2

共有7个长度为3的子串，每个长度为3的子串都不同。

Data Constraint

对于30%的数据，1≤��≤��≤200；
对于50%的数据，1≤��≤��≤2000；
对于另外20%的数据，1≤��≤50≤��≤200000；
对于100%的数据，1≤��≤��≤200000。

Solution

典型的字符串Hash，但是模数要开大点（或者双哈希），不然会被卡。
先算出前 m <script type="math/tex" id="MathJax-Element-12">m</script> 位的哈希值，之后一位一位推到后面即可。

Code

#include<cstdio>
#include<cstring>
using namespace std;
typedef long long LL;
const int N=2e5+5,mo=1e7+9;
const LL mod=1e15+7;
int n,m,ans;
LL sum,p;
LL h[mo];
int f[N];
char s[N];
inline int hash(LL x)
{
    int y=x%mo;
    while(h[y]>=0 && h[y]!=x) y=(y+1)%mo;
    return y;
}
int main()
{
    scanf("%d%d",&n,&m);
    scanf("%s",s+1);
    memset(h,-1,sizeof(h));
    ans=p=1;
    for(int i=m;i;i--)
    {
        sum=(sum+(s[i]-'a')*p%mod)%mod;
        if(i>1) p=p*26%mod;
    }
    h[hash(sum)]=sum;
    for(int i=2;i<=n-m+1;i++)
    {
        sum=(sum+mod-(s[i-1]-'a')*p%mod)%mod;
        sum=(sum*26%mod+s[i+m-1]-'a')%mod;
        int k=hash(sum);
        if(h[k]<0) h[k]=sum,ans++;
    }
    printf("%d",ans);
    return 0;
}