LINK
双哈希是为了解决哈希冲突的一种方法
题目:
示例1
输入
3
ab
ab
cabc
输出
3
示例2
输入
3
abc
a
cabc
输出
0
示例3
输入
4
hhh
hhh
hhh
hhh
输出
6
大致题意:
给出n个字符串,现寻找两个字符串相加后形成AA的形式,问:n个字符串中有多少满足题意。
说明:AA的形式为两个相同的字符串A,例如"abcdabcd"中A=“abcd”。
思路:
将每个字符串先双哈希,将此字符串双哈希值用一个map存起来;
然后寻找有无字符串中的前部分和后部分相同,
若存在,将此字符串中间部分的子串的双哈希值存在res数组中(例如"abcdab",此时若有字符串为"cd"则可以组成一个形为AA的字符串)
最后,统计与res中哈希值相同的字符串以及相同字符串的数目(相同字符串用公式(x*(x-1)/2)统计组合数。即答案。
代码:
#include<bits/stdc++.h>
using namespace std;
#define ll long long
#define ull unsigned long long
const ull mod1=1e9+7,mod2=2147483647;
const int N = 4e5+10;
const int p=131;
ull a1[N],a2[N],h1[N],h2[N];
pair<ull,ull>res[N];
map<pair<ull,ull>,ull>mp;
void hash1(string s){//预处理hash函数前缀和
a1[0]=1;
int n=s.size();
for(int i=1;i<=n;i++){
a1[i]=a1[i-1]*p%mod1;
h1[i]=(h1[i-1]*p%mod1+(s[i-1]-'a'+1))%mod1;
}
}
void hash2(string s){//预处理hash函数前缀和
a2[0]=1;
int n=s.size();
for(int i=1;i<=n;i++){
a2[i]=a2[i-1]*p%mod2;
h2[i]=(h2[i-1]*p%mod2+(s[i-1]-'a'+1))%mod2;
}
}
ull get1(int l,int r){//计算s[l--r]的hash值
return (h1[r]-h1[l-1]*a1[r-l+1]%mod1+mod1)%mod1;
}
ull get2(int l,int r){//计算s[l--r]的hash值
return (h2[r]-h2[l-1]*a2[r-l+1]%mod2+mod2)%mod2;
}
int main(){
int n;cin>>n;string s;
int pos=0;
while(n--){
cin>>s;
int len=s.size();
hash1(s);hash2(s);
mp[{h1[len],h2[len]}]++;
for(int i=1;i+i<len;i++){//寻找字符串s中前部分和后部分相同的子串
if(get1(1,i)==get1(len-i+1,len)&&get2(1,i)==get2(len-i+1,len)){
res[pos++]={get1(i+1,len-i),get2(i+1,len-i)};
}
}
}
ll ans=0;
for(int i=0;i<pos;i++){//统计与子串相同的字符串
ans+=mp[res[i]];
}
for(auto it:mp){//统计相同字符串
ans+=it.second*(it.second-1)/2;
}
cout<<ans<<endl;
return 0;
}