题目传送门
字符串哈希,说白了就是一个函数,你把一个字符串输入进去处理,输出一个更容易储存或者比较的东西,相当于一个加密的过程。但是对于同一个加密方法,可能会有不同字符串得到同样的结果的情况,所以我们要做的就是让字符串的哈希值尽量不相等。
一般我们现在接触到的字符串哈希,基本思想就是把它的每一位转化成一个特殊进制数的一个数位,这个大数可能会很大,如果我们直接比较大数,这就和直接比较字符串没什么区别。
我们认为,对哈希值这个大数取模,认为他与原来等效(在一定的错误率的情况下)。
单模数哈希
#include<bits/stdc++.h>
using namespace std;
const int N=1e4+5;
const int inf=0x7fffffff;
const int mod=1e9+7;
typedef long long ll;
#define fi first
#define se second
#define mp make_pair
#define pii pair<int,int>
//#define int long long
#define IOS ios::sync_with_stdio(false);cin.tie(0);cout.tie(0);
#define endl '\n'
int a[N];
int hashs(string s)
{
int sum=0;
for(int i=0;i<s.size();i++)
{
sum=(sum*137+s[i])%mod;
}
return sum;
}
signed main()
{
IOS;
int n;
cin>>n;
for(int i=1;i<=n;i++)
{
string s;
cin>>s;
int tt=hashs(s);
a[i]=tt;
}
int cnt=0;
sort(a+1,a+n+1);
for(int i=1;i<=n;i++)
{
if(a[i]!=a[i-1])
cnt++;
}
cout<<cnt<<endl;
}
双模数哈希(准确度更高但是更耗费时间)
#include<bits/stdc++.h>
using namespace std;
const int N=1e4+5;
const int inf=0x7fffffff;
const int mod1=1e9+7;
const int mod2=1e8+7;
typedef long long ll;
#define fi first
#define se second
#define mp make_pair
#define pii pair<int,int>
//#define int long long
#define IOS ios::sync_with_stdio(false);cin.tie(0);cout.tie(0);
#define endl '\n'
struct node
{
int x;int y;
node()
{
x=y=-1;
}
}a[N];
int hashs1(string s)
{
int sum=0;
for(int i=0;i<s.size();i++)
{
sum=(sum*137+s[i])%mod1;
}
return sum;
}
int hashs2(string s)
{
int sum=0;
for(int i=0;i<s.size();i++)
{
sum=(sum*137+s[i])%mod2;
}
return sum;
}
bool cmp(node a,node b)
{
if(a.x!=b.x)
return a.x<b.x;
return a.y<b.y;
}
signed main()
{
IOS;
int n;
cin>>n;
for(int i=1;i<=n;i++)
{
string s;
cin>>s;
int tt=hashs1(s);
a[i].x=tt;
tt=hashs2(s);
a[i].y=tt;
}
int cnt=0;
sort(a+1,a+n+1,cmp);
for(int i=1;i<=n;i++)
{
if(a[i].x!=a[i-1].x||a[i].y!=a[i-1].y)
cnt++;
}
cout<<cnt<<endl;
}
还有一种自然溢出发,就是用unsigened long long ,当这个哈希值溢出,他就会自己对2的64次方取模(比较偷懒,但是只能在出题人比较良心的情况下用 ,感兴趣的话CSDN吧)