7-2 破译报文
作者 朱允刚
单位 吉林大学
小明接到一个破解报文的任务:该报文是一串文本,破解出的密文应是在报文串中出现次数大于1的所有子串中的最长者。规定报文本身不能称为自己的子串。请编写效率尽可能高的程序帮小明完成这个棘手的任务。
输入格式:
输入为一个字符串,表示报文,包含不超过10000个字母。
输出格式:
输出为一个整数,表示破解出的密文串的长度。
输入样例1:
xabceabcf
输出样例1:
3
输入样例2:
xyabcabcayx
输出样例2:
4
题解:字符串哈希+二分
#include<bits/stdc++.h>
using namespace std;
const int N = 10010, mod = 1e9, P = 100007;
map<int,int> mp;
char str[N];
int h[N], p[N], n, ans;
int query(int l, int r){
return ((h[r] - h[l-1] * p[r-l+1] % mod) + mod) % mod;
//如何计算?
//h的计算是滚动哈希,因为乘以素数且加上前一位的字符值
//p[i]代表p^i,代表hash基数(权重)(即上面h乘的次数)
//所以要求一段区间的hash值,要用h[r]减去h[l - 1]乘以P^(r - l + 1)
//相当于把对手拉到跟自己一个长度(重量级),再相减
//得到真正l-r的哈希值
}
int judge(int x){
mp.clear();
for(int i = 0; i < n - x; ++i){
int hash = query(i+1, i+x+1); //为什么加1,因为计算的时候是【i+1】=【i】
if(mp[hash]) return 1;
mp[hash] = 1;
}
return 0;
}
int main(){
scanf("%s", &str);
n = strlen(str);
p[0] = 1;
for(int i = 0; i < n; ++i){
p[i+1] = p[i] * P; //每一位的权重
h[i+1] = h[i] * P + str[i]; //前缀和
}
//二分原因:单调,且一个重复的大串肯定包含重复的小子串
int l = 0, r = n-1;
while(l < r){
int mid = l+r >> 1;
if(judge(mid)) l = mid+1;
else r = mid;
}
cout << l << endl;
return 0;
}