哈希表算法详解

哈希表

哈希表(Hash table,也叫散列表),是根据关键码值(Key value)而直接进行访问的数据结构。也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。这个映射函数叫做哈希函数,存放记录的数组叫做哈希表

给定表M,存在函数f(key),对任意给定的关键字值key,代入函数后若能得到包含该关键字的记录在表中的地址,则称表M为哈希(Hash)表,函数f(key)为哈希(Hash) 函数。

哈希表的存储结构一般有两种,一个是开放寻址法,一个是拉链法。这两种存储结构在处理冲突上效果比较好。

哈希表用途

哈希表可以把一个比较庞大的空间映射到一个比较小的空间,一般情况下是映射到0~N,N一般是1e5,1e6的大小。比较常见的一种场景是把0-1e9的这些数映射到0-1e5。我们这里主要针对哈希表在算法上的用途,然后举一个案例来详细说明,不会讲解哈希表在数据结构上的实现。

哈希表冲突

上面说了什么是哈希函数,比如值域在-1e9~1e9的数,通过一个函数比如H(x)可以把这个值域中的数映射到0~1e5的之间的一个数。这个H(x)就是哈希函数。

哈希函数一般可以写成x mod 1e5这样的形式,这样对1e5取模后的范围一定在0~1e5,但是这样写可能会有冲突,可能有两个不一样的数映射到一个数,因为把一个庞大的空间映射到小空间肯定是映射不完的,一定会有冲突。所以我们要处理冲突,按照不同的处理方式我们把哈希表分成开放寻址发和拉链法。

拉链法

我们开一个一维数组来存储所有数的哈希值,比如我们映射到0~1e5的空间,那么我们就创建一个1e5大小的数组。拉链法是如何处理冲突的呢,我们给这个数组的上的每个位置都拉一条链,用来存储当前这个位置已经有的所有的数

我们举个栗子,假设H(x)是哈希函数,我们给每一个位置都拉一条链,如果H(13)=4,这样就把13映射到了4这个位置,我们把13放到4位置的链上去,如果H(34)=4,我们也把34放到4位置的链上去,如图所示。就是说两个数是冲突的,我们就用一个链把他们都存下来。

哈希表是一个期望算法,每个链可以看做一个常数,它的时间复杂度可以看做O(1)

这里的链我们用邻接表实现

开放寻址法

开放寻址法处理冲突的思路是什么呢,首先它是只开了一个一维数组,没有开一个链表。但是这个一维数组的长度要开到题目要求的两到三倍。它处理冲突的思路是如果某个数的哈希值这个位置被占了那么就去下一个位置,一直找到空的位置,这样就要给每一个哈希值留一定的空间来放置他们,这也是为什么开放寻址法要开这么大数组的原因。

下面我们用一个例题,分别用拉链法和开放寻址法解决 

例题

维护一个集合,支持如下几种操作:

  1. I x,插入一个数 x;
  2. Q x,询问数 x 是否在集合中出现过;

现在要进行 N 次操作,对于每个询问操作输出对应的结果。

输入格式

第一行包含整数 N,表示操作数量。

接下来 N 行,每行包含一个操作指令,操作指令为 I xQ x 中的一种。

输出格式

对于每个询问指令 Q x,输出一个询问结果,如果 x 在集合中出现过,则输出 Yes,否则输出 No

每个结果占一行。

数据范围

1≤N≤1e5
−1e9≤x≤1e9

输入样例:

5
I 1
I 2
I 3
Q 2
Q 5

输出样例:

Yes
No

拉链法

#include <iostream>
#include <cmath>
#include <cstring>
using namespace std;
const int N=1e5+10;
int h[N];//映射到的槽
int e[N],ne[N],idx;//邻接表模板
//插入一个数
void insert(int x)
{
    int k=abs(x%N);
    //邻接表模板,头插法
    e[idx]=x;
    ne[idx]=h[k];
    h[k]=idx++;
}
//查询一个数
bool find(int x)
{
    int k=abs(x%N);
    for(int i=h[k];i!=-1;i=ne[i])
    {
        if(x==e[i])
        return true;
    }
    return false;
}
int main()
{
    int n;
    cin>>n;
    //初始化槽,每个槽都是一个头结点
    memset(h,-1,sizeof h);
    for(int i=0;i<n;i++)
    {
        char op;
        int x;
        cin>>op>>x;
        if(op=='I')
        insert(x);
        else
        {
            if(find(x)) cout<<"Yes"<<endl;
            else
            cout<<"No"<<endl;
        }
    }
    return 0;
}

开放寻址法

#include <iostream>
#include <cstring>
#include <cmath>
using namespace std;
//开放寻址法一般开数据范围的 2~3倍, 这样大概率就没有冲突了
const int N=2e5+3,null=0x3f3f3f3f;//N为大于范围的第一个质数,规定空指针为0x3f3f3f3f
int h[N];
//find函数可以返回要插入的位置k和查找某个数在h数组的位置
int find(int x)
{
    int k=abs(x%N);
    //如果这个位置为空的话,返回位置k(插入)
    //如果这个位置的h[k]等于这个数,说明找到这个数的位置返回位置k(查找)
    while(h[k]!=null&&h[k]!=x)
    {
       k++;
       if(k==N) k=0;
    }
    return k;
}
int main()
{
    int n;
    cin>>n;
    //memset按一个字节读,h是int类型,一个字节是0x3f,四个字节就是0x3f3f3f3f,所以h数组的每个数都是0x3f3f3f3f
    memset(h,0x3f,sizeof h);
    while(n--)
    {
        string op;
        cin>>op;
        int x;
        cin>>x;
        if(op=="I")
        h[find(x)]=x;//先找到插入的位置,然后再更新h数组的值
        else
        {
            if(h[find(x)]!=null) cout<<"Yes\n";//如果这个位置的h数组的值为null,说明找不到这个数,输入no
            else
            cout<<"No\n";
        }
    }
    return 0;
}

也可以用stl写,但是理解了原理是最好的

#include <iostream>
#include <unordered_map>
using namespace std;
unordered_map<int,int>m;
int main()
{
    int n;
    cin>>n;
    while(n--)
    {
        char op;
        cin>>op;
        int x;
        cin>>x;
        if(op=='I')
        {
            m[x]++;
        }
        else
        {
            if(m[x]>0)
            cout<<"Yes\n";
            else
            cout<<"No\n";
        }
    }
    return 0;
}

如有错漏之处,敬请指正!

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
哈希表是一种常用的数据结构,它通过哈希函数将键映射到存储位置,以实现高效的数据查找和插入操作。哈希函数是一种提取数据特征的算法,根据不同的数据形式和场景,可以选择不同的哈希算法。常见的哈希算法包括MD5等。\[1\] 在哈希表中,哈希函数的优劣直接影响到哈希表的查找效率。优秀的哈希函数可以减少冲突的发生,提高查找效率。哈希函数的设计方法有多种,其中常见的包括直接寻址法、除留余数法、平方取中法等。不同的哈希函数适用于不同的数据类型和规律。\[3\] 哈希冲突是指不同的键经过哈希函数计算后得到相同的哈希值,导致数据存储位置冲突的情况。为了解决哈希冲突,常用的方法有开放寻址法和链地址法。开放寻址法是指当发生冲突时,通过一定的规则在哈希表中寻找下一个可用的位置来存储数据。链地址法是指在哈希表的每个位置上维护一个链表,将哈希值相同的键值对存储在同一个链表中。\[2\] 总结来说,哈希表是一种通过哈希函数将键映射到存储位置的数据结构,常用的哈希算法有多种,哈希函数的设计方法也有多种,而哈希冲突的处理方法包括开放寻址法和链地址法。这些算法和数据结构的选择取决于具体的应用场景和需求。 #### 引用[.reference_title] - *1* [详解哈希数据结构,手写哈希表](https://blog.csdn.net/CRMEB/article/details/120820682)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [数据结构之哈希表以及常用哈希的算法表达(含全部代码)](https://blog.csdn.net/weixin_53050357/article/details/126666617)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [哈希表-数据结构(C语言)](https://blog.csdn.net/weixin_44681349/article/details/124782035)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

真的没事鸭

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值