数据结构与算法---哈希表

哈希表是一种数据结构,通过哈希函数将键映射到槽中,实现快速查找。常见的哈希冲突解决方案有链地址法和开放地址法,如线性探测再散列。哈希表在查找、插入和删除操作上具有较高的效率,但需注意哈希冲突和数据量对性能的影响。
摘要由CSDN通过智能技术生成

数据结构与算法—哈希表

1. 概述
1.1 哈希表概念
散列表(Hash table,也叫哈希表),是根据关键码值(Key value)而直接进行访问的数据结构。也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。这个映射函数叫做散列函数,存放记录的数组叫做散列表。
给定表M,存在函数f(key),对任意给定的关键字值key,代入函数后若能得到包含该关键字的记录在表中的地址,则称表M为哈希(Hash)表,函数f(key)为哈希(Hash) 函数。
哈希表是一种通过哈希函数将特定的键映射到特定值的一种数据结构,他维护者键和值之间一一对应关系。
1.2 键—key
键(key):又称为关键字。唯一的标示要存储的数据,可以是数据本身或者数据的一部分。
1.3 槽–slot/bucket
槽(slot/bucket):哈希表中用于保存数据的一个单元,也就是数据真正存放的容器。
1.4 哈希函数
哈希函数(hash function):将键(key)映射(map)到数据应该存放的槽(slot)所在位置的函数。
1.5 哈希冲突
哈希冲突(hash collision):哈希函数将两个不同的键映射到同一个索引的情况。
举一个简单的例子,如下图所示:
这里写图片描述
左边很明显是个数组,数组的每个成员包括一个指针,指向一个链表的头,当然这个链表可能为空,也可能元素很多。我们根据元素的一些特征把元素分配到不同的链表中去,也是根据这些特征,找到正确的链表,再从链表中找出这个元素。
1.6 哈希表的优缺点
优点:不论哈希表中有多少数据,查找、插入、删除(有时包括删除)只需要接近常量的时间即0(1)的时间级。实际上,这只需要几条机器指令。
哈希表运算得非常快,在计算机程序中,如果需要在一秒种内查找上千条记录通常使用哈希表(例如拼写检查器)哈希表的速度明显比树快,树的操作通常需要O(N)的时间级。哈希表不仅速度快,编程实现也相对容易。
如果不需要有序遍历数据,并且可以提前预测数据量的大小。那么哈希表在速度和易用性方面是无与伦比的。
缺点:它是基于数组的,数组创建后难于扩展,某些哈希表被基本填满时,性能下降得非常严重,所以程序员必须要清楚表中将要存储多少数据(或者准备好定期地把数据转移到更大的哈希表中,这是个费时的过程)。
2. 常用的散列法
元素特征转变为数组下标的方法就是散列法。散列法当然不止一种,有三种比较常用的散列法,下面一一介绍。
2.1 除法散列法
最直观的一种,上图使用的就是这种散列法,公式:

      index = value % 16 

学过汇编的都知道,求模数其实是通过一个除法运算得到的,所以叫“除法散列法”。
2.2 平方散列法
求index是非常频繁的操作,而乘法的运算要比除法来得省时(对现在的CPU来说,估计我们感觉不出来),所以我们考虑把除法换成乘法和一个位移操作。公式:


                
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值