题目大意:
题目链接:https://jzoj.net/senior/#main/show/5462
题目图片:
http://wx4.sinaimg.cn/mw690/0060lm7Tly1fwena030iwj30j70ba74m.jpg
http://wx2.sinaimg.cn/mw690/0060lm7Tly1fwena02ec5j30ja0eb74j.jpg
给出一个长度为
n
n
n的小写字母组成的字符串,求其中有几个不同的(断句)长度为
m
m
m的子串。
思路:
50分做法:
1
≤
m
≤
n
≤
2000
1≤m≤n≤2000
1≤m≤n≤2000
枚举子串开始的位置,再将接下来的
m
m
m位扔进
T
r
i
e
Trie
Trie里,记录答案即可。
时间复杂度
O
(
n
2
l
o
g
)
O(n^2log)
O(n2log)
代码
100分做法:
1
≤
m
≤
n
≤
200000
1≤m≤n≤200000
1≤m≤n≤200000
字符串
H
A
S
H
HASH
HASH。
这道题很诡异的卡单哈希,所以得用双哈希。
我们假设有一个字符串是这样的:
- c [ ] = i a m j u r u o c[]=iamjuruo c[]=iamjuruo
那么我们可以取出它前面的 i i i位。
- s [ 1 ] = c [ 1 ] = i s[1]=c[1]=i s[1]=c[1]=i
- s [ 2 ] = s [ 1 ] + c [ 2 ] = i a s[2]=s[1]+c[2]=ia s[2]=s[1]+c[2]=ia
- s [ 3 ] = s [ 2 ] + c [ 3 ] = i a m s[3]=s[2]+c[3]=iam s[3]=s[2]+c[3]=iam
- s [ 4 ] = s [ 3 ] + c [ 4 ] = i a m j s[4]=s[3]+c[4]=iamj s[4]=s[3]+c[4]=iamj
- . . . . . . ...... ......
- s [ 8 ] = s [ 7 ] + c [ 8 ] = i a m j u r u o s[8]=s[7]+c[8]=iamjuruo s[8]=s[7]+c[8]=iamjuruo
那么如果我们呢要取出这个字符串的第
l
l
l到
r
r
r位,那么应该怎么取呢?
我们假设这个字符串是一个十进制数字。
- c [ ] = 12345678 c[]=12345678 c[]=12345678
- s [ 1 ] = 1 s[1]=1 s[1]=1
- s [ 2 ] = 12 s[2]=12 s[2]=12
- s [ 3 ] = 123 s[3]=123 s[3]=123
- . . . . . . ...... ......
- s [ 8 ] = 12345678 s[8]=12345678 s[8]=12345678
那么如果我们要取出这个数字串的第
3
3
3到
6
6
6位,那么自然就是:
a
n
s
=
s
[
6
]
−
s
[
3
−
1
]
×
1
0
6
−
(
3
−
1
)
ans=s[6]-s[3-1]\times 10^{6-(3-1)}
ans=s[6]−s[3−1]×106−(3−1)
那么我们可以进一步得到,如果我们要取出这个字符串的第
l
l
l到
r
r
r位,那么就是
a
n
s
=
s
[
r
]
−
s
[
l
−
1
]
×
1
0
r
−
(
l
−
1
)
ans=s[r]-s[l-1]\times 10^{r-(l-1)}
ans=s[r]−s[l−1]×10r−(l−1)
所以,如果我们把这个字符串看成一个BASE进制的数字串
,就可以按照上述公式求第
l
l
l到
r
r
r位。
那么就有:
a
n
s
=
s
[
r
]
−
s
[
l
−
1
]
×
B
A
S
E
r
−
(
l
−
1
)
ans=s[r]-s[l-1]\times BASE^{\ r-(l-1)}
ans=s[r]−s[l−1]×BASE r−(l−1)
所以,哈希就可以这样用了。
时间复杂度:
O
(
n
l
o
g
)
O(nlog)
O(nlog)
代码:
#include <cstdio>
#include <cstring>
#include <map>
#include <iostream>
#define MOD1 290182597
#define MOD2 163227661
#define BASE1 3769
#define BASE2 9439
#define N 200100
#define ll long long
#define mp make_pair
using namespace std;
int n,m,pow1[N],pow2[N],hash1[N],hash2[N],ans;
char c[N];
map<pair<int,int>,int> p;
ll find1(int l,int r)
{
return (hash1[r]-(ll)hash1[l-1]*pow1[r-l+1]%MOD1+MOD1)%MOD1; //上述公式
}
ll find2(int l,int r)
{
return (hash2[r]-(ll)hash2[l-1]*pow2[r-l+1]%MOD2+MOD2)%MOD2;
}
int main()
{
scanf("%d%d",&n,&m);
cin>>c+1;
pow1[0]=1;
pow2[0]=1;
for (int i=1;i<=n;i++)
{
pow1[i]=((ll)pow1[i-1]*BASE1)%MOD1;
pow2[i]=((ll)pow2[i-1]*BASE2)%MOD2; //取出BASE的x次方
hash1[i]=((ll)hash1[i-1]*BASE1%MOD1+c[i]-'a'+1)%MOD1;
hash2[i]=((ll)hash2[i-1]*BASE2%MOD2+c[i]-'a'+1)%MOD2; //HASH函数
}
ll x,y;
for (int i=1;i<=n-m+1;i++)
{
x=find1(i,i+m-1);
y=find2(i,i+m-1);
if (!p[mp(x,y)]) ans++; //没有出现过
p[mp(x,y)]=1;
}
printf("%d\n",ans);
return 0;
}