题目链接:
[HDU 4821]String[字符串hash]
题意分析:
给出一个字符串s,寻找满足下列两个条件的子串(我们称之为D串)个数:1、长度为m * l;2、将这个子串切割成长度为l,首尾相连的m个子串,这些子串各不相同。
解题思路:
从第一位开始,每一个长度为m*l的子串都去判断。可以发现,从0开始的子串,和从l开始的子串,前者比后者多了子串[0, l),后者比前者多了子串[0 + m * l, 0 + m * l + l)。所以我们只需要预处理出,从位置0、1、2.....l - 1开始的子串,后面的子串只需利用前面的结果即可。
剩下的问题是怎么哈希。将字符串看成是个31进制数,(取素数冲突概率能减少,强有力的证据目前自己找不到)。hs[i]记录从i之后的字符代表的hash值,那么段[i, i + l)的hash值就为:hash[i] - hash[i + l] * base[l],base[i]为基底31的i次方。(这里为什么这么减就能代表该段的hash值,也不大理解)
个人感受:
想着写题解,发现一写好多疑问,希望明白的朋友能不吝啬赐教Orz
具体代码如下:
#include<algorithm>
#include<cctype>
#include<cmath>
#include<cstdio>
#include<cstring>
#include<iomanip>
#include<iostream>
#include<map>
#include<queue>
#include<set>
#include<sstream>
#include<stack>
#include<string>
#define ull unsigned long long
#define pr(x) cout << #x << " = " << (x) << '\n';
using namespace std;
const int INF = 0x7f7f7f7f;
const int MAXN = 1e5 + 111;
char s[MAXN];
ull hs[MAXN], base[MAXN];
map<ull, int> mp[MAXN];
void init() {
base[0] = 1;
for (int i = 1; i < MAXN; ++i) base[i] = base[i - 1] * 31;
}
ull getVal(int st, int len) {
return hs[st] - hs[st + len] * base[len];
}
int main()
{
init();
int m, l;
while (~scanf("%d%d", &m, &l)) {
scanf("%s", s);
int len = strlen(s);
hs[len] = 0;
for (int i = len - 1; i >= 0; --i) {
hs[i] = hs[i + 1] * base[1] + s[i] - 'a';
}
int ans = 0, up = m * l;
for (int i = 0; i < l && i + up - 1 < len; ++i) {
mp[i].clear();
int st = i;
for (int j = 0; j < m; st += l, ++j) {
ull val = getVal(st, l);
if (mp[i].count(val)) ++mp[i][val];
else mp[i].insert(make_pair(val, 1));
}
if (mp[i].size() == m) ++ans;
}
for (int i = l; i + up - 1 < len; ++i) {
ull val = getVal(i - l, l);
int v = i % l;
--mp[v][val];
if (mp[v][val] == 0) mp[v].erase(val);
val = getVal(i + up - l, l);
if (mp[v].count(val)) ++mp[v][val];
else mp[v].insert(make_pair(val, 1));
if (mp[v].size() == m) ++ans;
}
printf("%d\n", ans);
}
return 0;
}