字符串hash
看一个问题,有m个字符串,共有q个询问,询问两个字符串是否完全一样
假设每一次都比较两个较长的字符串,那么每次比较都会需要很长的时间,会炸的
我们将字符串转化为一个数字,依据10进制方法
但是可能字符串较大的数字会非常大,存不下来
一个欺骗的方法就是找一个很大的数p最好是质数,只记录后数字对p取模
这里注意,不能把a看作0,不然a会和aa相同滴
取的进制也要和p互质才行
#include<cstdio>
#include<iostream>
#include<algorithm>
#include<queue>
#include<cstring>
#include<algorithm>
using namespace std;
const int SIZE=5e5+5;
typedef long long ll;
int n;
int base=131;
char s[SIZE];
int a[SIZE];
int ans;
ll hash(char s[])
{
int len=strlen(s);
ll ans=0;
for(int i=0;i<len;i++)
{
ans=ans*base+(ll)s[i];//转化为数字
}
return ans%99999999;
}
int main()
{
cin>>n;
for(int i=1;i<=n;i++)
{
cin>>s;
a[i]=hash(s);//每一个字符串都获取一个hash值
}
sort(a+1,a+1+n);//为接下来的比较准备
for(int i=1;i<=n;i++)
{
if(a[i]!=a[i-1])
ans++;
}
cout<<ans<<endl;
return 0;
}