字符串哈希-String-HDU4821
题意:
给 定 两 个 整 数 m , l 以 及 一 个 字 符 串 s t r , 定 义 : 若 字 符 串 p 的 长 度 为 m ∗ l , 且 p 的 m 个 长 度 为 l 的 连 续 子 串 互 不 相 同 , 则 称 p 是 “ 可 恢 复 的 ” 。 给定两个整数m,l以及一个字符串str,\\定义:若字符串p的长度为m*l,且p的m个长度为l的连续子串互不相同,则称p是“可恢复的”。 给定两个整数m,l以及一个字符串str,定义:若字符串p的长度为m∗l,且p的m个长度为l的连续子串互不相同,则称p是“可恢复的”。
计 算 出 s t r 中 有 多 少 个 子 串 是 “ 可 恢 复 的 ” 。 计算出str中有多少个子串是“可恢复的”。 计算出str中有多少个子串是“可恢复的”。
样 例 : 输 入 : 3 3 a b c a b c b c a a b c 输 出 : 2 样例:\\输入:\\3 \ \ 3 \\abcabcbcaabc\\输出:\\2 样例:输入:3 3abcabcbcaabc输出:2
字 符 串 : “ a b c a b c b c a a b c " 中 , 满 足 长 度 为 9 的 “ 可 恢 复 ” 子 串 有 “ b c a b c b c a a ” 和 “ c a b c b c a a b ” , 因 此 答 案 为 2 。 字符串:“abcabcbcaabc"中,满足长度为9的“可恢复”子串有“bcabcbcaa”和“cabcbcaab”,因此答案为2。 字符串:“abcabcbcaabc"中,满足长度为9的“可恢复”子串有“bcabcbcaa”和“cabcbcaab”,因此答案为2。
题解:
若 枚 举 p 的 起 点 , 然 后 暴 力 统 计 一 定 是 不 行 的 。 若枚举p的起点,然后暴力统计一定是不行的。 若枚举p的起点,然后暴力统计一定是不行的。
对 于 每 一 个 “ 可 恢 复 ” 的 子 串 p , 我 们 可 以 将 这 个 长 度 为 m ∗ l 的 区 间 向 后 滑 动 l 个 单 位 长 度 , 即 剔 除 首 部 的 子 串 , 在 尾 部 接 入 新 的 子 串 , 直 到 整 个 字 符 串 s t r 的 尾 部 , 同 时 用 m a p 记 录 m 个 子 串 的 哈 希 值 , 统 计 不 同 哈 希 值 的 子 串 的 个 数 , 若 为 m , 则 满 足 条 件 。 对于每一个“可恢复”的子串p,我们可以将这个长度为m*l的区间向后滑动l个单位长度,\\即剔除首部的子串,在尾部接入新的子串,直到整个字符串str的尾部,\\同时用map记录m个子串的哈希值,统计不同哈希值的子串的个数,若为m,则满足条件。 对于每一个“可恢复”的子串p,我们可以将这个长度为m∗l的区间向后滑动l个单位长度,即剔除首部的子串,在尾部接入新的子串,直到整个字符串str的尾部,同时用map记录m个子串的哈希值,统计不同哈希值的子串的个数,若为m,则满足条件。
关 键 的 是 , 因 为 每 一 个 最 小 子 串 的 长 度 都 是 l , 因 此 p 滑 动 的 起 点 仅 需 考 虑 s t r 的 前 l 个 字 符 。 关键的是,因为每一个最小子串的长度都是l,因此p滑动的起点仅需考虑str的前l个字符。 关键的是,因为每一个最小子串的长度都是l,因此p滑动的起点仅需考虑str的前l个字符。
拿
样
例
说
明
:
第
一
趟
:
拿样例说明:\\第一趟:
拿样例说明:第一趟:
接
着
滑
动
l
=
3
个
单
位
长
度
:
接着滑动l=3个单位长度:
接着滑动l=3个单位长度:
舍
去
前
l
=
3
个
字
符
,
增
加
后
l
=
3
个
字
符
。
舍去前l=3个字符,增加后l=3个字符。
舍去前l=3个字符,增加后l=3个字符。
第
二
趟
:
第二趟:
第二趟:
第
三
趟
:
第三趟:
第三趟:
到
这
里
就
已
遍
历
完
所
有
的
子
串
p
,
因
为
若
从
第
l
+
1
=
4
个
字
符
继
续
开
始
遍
历
,
是
重
复
计
算
。
如
下
图
,
已
经
在
第
一
趟
被
考
虑
过
了
。
到这里就已遍历完所有的子串p,因为若从第l+1=4个字符继续开始遍历,是重复计算。\\如下图,已经在第一趟被考虑过了。
到这里就已遍历完所有的子串p,因为若从第l+1=4个字符继续开始遍历,是重复计算。如下图,已经在第一趟被考虑过了。
代码:
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<map>
#define ull unsigned long long
using namespace std;
const int N=1e5+10;
ull base=131,p[N],h[N];
int n,m,l,ans;
char str[N];
map<ull,int> mp;
int main()
{
int i,j;
ull tmp;
p[0]=1;
for(i=1;i<N;i++) p[i]=p[i-1]*base;
while(~scanf("%d%d",&m,&l))
{
scanf("%s",str);
n=strlen(str);
h[n]=0;
for(i=n-1;i>=0;i--)
{
h[i]=h[i+1]*base+str[i]-'a';
}
ans=0;
for(i=0;i<l&&i+m*l<=n;i++)
{
mp.clear();
for(j=i;j<i+m*l;j+=l)
{
tmp=h[j]-h[j+l]*p[l];
mp[tmp]++;
}
if(mp.size()==m) ans++;
for(j=i+m*l;j+l<=n;j+=l)
{
tmp=h[j-m*l]-h[j-(m-1)*l]*p[l];
mp[tmp]--;
if(mp[tmp]==0) mp.erase(tmp);
tmp=h[j]-h[j+l]*p[l];
mp[tmp]++;
if(mp.size()==m) ans++;
}
}
printf("%d\n",ans);
}
return 0;
}