【模板】字符串哈希

35 篇文章 0 订阅

题目传送门

字符串哈希,说白了就是一个函数,你把一个字符串输入进去处理,输出一个更容易储存或者比较的东西,相当于一个加密的过程。但是对于同一个加密方法,可能会有不同字符串得到同样的结果的情况,所以我们要做的就是让字符串的哈希值尽量不相等。

一般我们现在接触到的字符串哈希,基本思想就是把它的每一位转化成一个特殊进制数的一个数位,这个大数可能会很大,如果我们直接比较大数,这就和直接比较字符串没什么区别。

我们认为,对哈希值这个大数取模,认为他与原来等效(在一定的错误率的情况下)。

单模数哈希

#include<bits/stdc++.h>
using namespace std;
const int N=1e4+5;
const int inf=0x7fffffff;
const int mod=1e9+7;
typedef long long ll;
#define fi first
#define se second
#define mp make_pair
#define pii pair<int,int>
//#define int long long
#define IOS ios::sync_with_stdio(false);cin.tie(0);cout.tie(0);
#define endl '\n'
int a[N];
int hashs(string s)
{
    int sum=0;
    for(int i=0;i<s.size();i++)
    {
        sum=(sum*137+s[i])%mod;
    }
    return sum;
}
signed main()
{
    IOS;
    int n;
    cin>>n;
    for(int i=1;i<=n;i++)
    {
        string s;
        cin>>s;
        int tt=hashs(s);
        a[i]=tt;
    }
    int cnt=0;
    sort(a+1,a+n+1);
    for(int i=1;i<=n;i++)
    {
        if(a[i]!=a[i-1])
            cnt++;
    }
    cout<<cnt<<endl;
}

双模数哈希(准确度更高但是更耗费时间)

#include<bits/stdc++.h>
using namespace std;
const int N=1e4+5;
const int inf=0x7fffffff;
const int mod1=1e9+7;
const int mod2=1e8+7;
typedef long long ll;
#define fi first
#define se second
#define mp make_pair
#define pii pair<int,int>
//#define int long long
#define IOS ios::sync_with_stdio(false);cin.tie(0);cout.tie(0);
#define endl '\n'
struct node
{
    int x;int y;
    node()
    {
        x=y=-1;
    }
}a[N];
int hashs1(string s)
{
    int sum=0;
    for(int i=0;i<s.size();i++)
    {
        sum=(sum*137+s[i])%mod1;
    }
    return sum;
}
int hashs2(string s)
{
    int sum=0;
    for(int i=0;i<s.size();i++)
    {
        sum=(sum*137+s[i])%mod2;
    }
    return sum;
}
bool cmp(node a,node b)
{
    if(a.x!=b.x)
        return a.x<b.x;
    return a.y<b.y;
}
signed main()
{
    IOS;
    int n;
    cin>>n;
    for(int i=1;i<=n;i++)
    {
        string s;
        cin>>s;
        int tt=hashs1(s);
        a[i].x=tt;
        tt=hashs2(s);
        a[i].y=tt;
    }
    int cnt=0;
    sort(a+1,a+n+1,cmp);
    for(int i=1;i<=n;i++)
    {
        if(a[i].x!=a[i-1].x||a[i].y!=a[i-1].y)
            cnt++;
    }
    cout<<cnt<<endl;
}

还有一种自然溢出发,就是用unsigened long long ,当这个哈希值溢出,他就会自己对2的64次方取模(比较偷懒,但是只能在出题人比较良心的情况下用 ,感兴趣的话CSDN吧)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值