带你手撕哈希(hash)表【数组】

本文介绍了哈希的概念、哈希函数的作用、哈希冲突的处理方法(如拉链法和开放寻址法),以及字符串哈希的实现,重点展示了前缀哈希和进制转换在实际问题中的应用。
摘要由CSDN通过智能技术生成

思维导图

hash
散列表
字符串哈希
拉链法
开放寻址法

哈希

哈希的本质是映射,把一个较大范围的数据映射到一个较小的数据里面,从而更方便的进行某些操作。
在这里插入图片描述

哈希函数

通过某种函数关系,将一堆较大范围的数据映射成较小范围的数据,这样的函数关系就叫做哈希函数,比如我们设较大范围的数据为x,较小范围的数据为y,常用的函数为 y = x % mod。

哈希冲突

我们把一个很大范围的数据映射到一个较小范围的数据中,则必然存在至少两个x被映射被映射到同一个y中,这便是哈希冲突,如何尽可能的规避哈希冲突是哈希问题的一个很重要的问题。

散列表

我们先引入一个例题。
在这里插入图片描述

拉链法

在这里插入图片描述
所谓拉链法便是将x通过y = x % mod找到对应的y,从而在y的下面拉一条链子,注意每次拉链是在y头拉。

时间复杂度:因为通常我们这个链子也不会很长,基本是1到3个,这相对于1e5来说近似o(1)。

#include<bits/stdc++.h>

using namespace std;

const int N = 100003;//取质数从数学的角度来说可以最大程度的避免哈希冲突

int h[N], ne[N], e[N], idx;

void insert(int x){
    int k = (x % N + N) % N;//哈希函数
    e[idx] = x, ne[idx] = h[k], h[k] = idx ++;//链表
}

bool find(int x){
    int k = (x % N + N) % N;
    for(int i = h[k];i != -1;i = ne[i]){//遍历
        int j = e[i];
        if(j == x) return true;
    }
    return false;
}

int main(){
    ios::sync_with_stdio(false);
    cin.tie(0);
    memset(h, -1, sizeof h);
    int n;
    cin >> n;
    while(n --){
        char op;
        cin >> op;
        if(op == 'I'){
            int x;
            cin >> x;
            insert(x);
        }else{
            int x;
            cin >> x;
            if(find(x)) cout << "Yes" << "\n";
            else cout << "No" << "\n";
        }
    }
    return 0;
}

我们可以把这个看成一个图,也可以开一个二维数组存。

#include<bits/stdc++.h>

using namespace std;

const int N = 100003;

vector<vector<int>> e(N);

void insert(int x){
    int k = (x % N + N) % N;
    e[k].push_back(x);
} 

bool find(int x){
    int k = (x % N + N) % N;
    for(auto i : e[k]){
        if(i == x) return true;
    }
    return false;
}

int main(){
    ios::sync_with_stdio(false);
    cin.tie(0);
    int n;
    cin >> n;
    while(n --){
        char op;
        cin >> op;
        if(op == 'I'){
            int x;
            cin >> x;
            insert(x);
        }else{
            int x;
            cin >> x;
            if(find(x)) cout << "Yes" << "\n";
            else cout << "No" << "\n";
        }
    }
    return 0;
}

开放寻址法

在这里插入图片描述
开放寻址法俗称蹲坑法,假如我们要映射到1e5,这时我们需要开一个比这个数据范围更大一点约为2到3倍的数组,然后通过y = x % mod,找到y,看看y这个坑位里面有没有人,没人我就蹲,有人我就找下一个。

#include<bits/stdc++.h>

using namespace std;

const int N = 200003, null = 0x3f3f3f3f;

int h[N];

int find(int x){
   int k = (x % N + N) % N;
   while(h[k] != null && h[k] != x){//有人就找下一个
       k ++;
       if(k == N) k = 0;
   }
   return k;
}

int main(){
    ios::sync_with_stdio(false);
    cin.tie(0);
    memset(h, 0x3f, sizeof h);
    int n;
    cin >> n;
    while(n --){
        char op; 
        int x;
        cin >> op >> x;
        if(op == 'I'){
            int k = find(x);
            h[k] = x;
        }else{
            int k = find(x);
            if(h[k] != null) cout << "Yes" << "\n";
            else{
                cout << "No" << "\n";
            }
        }
    }
    return 0;
}

字符串哈希

我们这里用的字符串哈希方法是字符串前缀哈希方法。
在这里插入图片描述
h函数存的值为前几个字母所映射的哈希值,而怎么把字符串转化为哈希值呢,我们这里采用一个奇妙的办法——进制。
在这里插入图片描述
通过这种方式, 我们就非常神奇的将每一个前缀字符串存到h数组了。

但还有两个问题,p和q应该取啥呢,从数学上讲,当p取131或者13331,q取2的64次方,这时可以最大程度的避免哈希冲突,然后我们这里用到一个技巧,我们在设h数组就把数组类型设成unsigned long long(范围为0 到 2的64次方 - 1),这样根据一点机组的知识,编译器就会自动帮我们取模了。

接下来我们引入一个例题。
在这里插入图片描述
我们先给出AC代码,再逐步讲解:

#include<bits/stdc++.h>

using namespace std;

typedef unsigned long long ull;
const int N = 1e5 + 10, P = 131;

int n, m;
char s[N];
ull h[N], p[N];

ull get(int l, int r){
    return h[r] - h[l - 1] * p[r - l + 1];//区间公式
}

int main(){
    ios::sync_with_stdio(false);
    cin.tie(0);
    cin >> n >> m >> s+1;
    p[0] = 1;
    for(int i = 1;i <= n;i ++){
        p[i] = p[i - 1] * P;//进制
        h[i] = h[i - 1] * P + s[i];//前缀和公式 
    }
    while(m --){
        int l1, r1, l2, r2;
        cin >> l1 >> r1 >> l2 >> r2;
        if(get(l1, r1) == get(l2, r2)){
            puts("Yes");
        }else{
            puts("No");
        }
    }
    return 0;
}

首先我们先介绍这个前缀和公式:
在这里插入图片描述
用这种方式我们就可以完美表示前缀字符串的哈希值。
接下来就是求区间(子串)了
在这里插入图片描述
这样我们就可以求区间了。
这道题的整个时间复杂度为o(n) + o(m)(每次查询时的时间复杂度是近似O(1)的时间复杂度。

  • 10
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值