哈希表

一.哈希表的概念
哈希表又称散列表:把关键码值映射到表中的一个位置来访问记录,以加快查找的速度,映射函数叫散列函数,存放记录的数组叫散列表.
把key通过一个固定的算法函数转换成一个整型数字,然后就将该数组对数组长度取余,取余结果就当做数组的下标,将value存储在一以该数字为下标的数组空间里.
二.哈希函数的构造方法(函数本身便于计算,计算出来的地址分布均匀)
1.数字分析法:如果事先知道有关键字集合,并且每个关键字的位数比哈希表的地址码位数多时,可以从关键字中选出较均匀的若干位,构成哈希地址.
**例子:**有80个记录,关键字为8位十进制整数d1,d2,d3…d8,如哈希表的地址空间为00-99,假设经过分析之后,d3和d6的取值分布比较均匀,则哈希函数:h(key)=h(d1d2d3…d7d8)=d3d6
在这里插入图片描述
2.平方取中法:无法确定关键字在哪几位分布较均匀的时候,我们可以先求出关键字的平方值,然后按照需求取平方值的中间几位作为哈希地址.
这样做的原因是:平方后中间几位和关键字中每一位都相关,故不同关键字会以较高的概率产生不同的哈希地址.
在这里插入图片描述
3.分段叠加法:按照哈希地址位数将关键字分成位数相等的几部分(最后一位位数可以较短),然后将这几部分相加,舍弃最高进位后的结果就是该关键字的哈希地址.
在这里插入图片描述
4.除留余数法:假设哈希表长为m,p为小于等于m的最大素数,则哈希函数为h(k)=k%p,其中%为模.
在这里插入图片描述
三.哈希表的处理冲突方法
1.开放定址法:key的哈希地址p=H(key)出现冲突时,以p为基础产生另外一个哈希地址p1,如果p1仍然冲突,再以p为基础,产生另一个哈希地址p2,直到找出一个不冲突的哈希地址pi将相应元素存入其中.
2.再哈希法:同时构造多个不同的哈希函数:Hi=RH(key),当哈希地址Hi=RH1(key)发生冲突时,再计算Hi=RH2(key)直到冲突不再产生为止.(这种方法不易产生聚集,但是增加了计算时间)
3.拉链法:将所有哈希地址为i的元素构成一个称为同义词链的单链表,并将单链表的头指针存在哈希表的第i个单元中,因而查找,插入,删除主要在同义词链中进行(链地址法适用于经常进行插入和删除的情况)
在这里插入图片描述
4.建立公共溢出区:将哈希表分为基本表和溢出表两部分,凡是和基本表发生冲突的元素,一律填入溢出表.
Hash的应用
1、Hash主要用于信息安全领域中加密算法,它把一些不同长度的信息转化成杂乱的128位的编码,这些编码值叫做Hash值. 也可以说,Hash就是找到一种数据内容和数据存放地址之间的映射关系。
2、查找:哈希表,又称为散列,是一种更加快捷的查找技术。我们之前的查找,都是这样一种思路:集合中拿出来一个元素,看看是否与我们要找的相等,如果不等,缩小范围,继续查找。而哈希表是完全另外一种思路:当我知道key值以后,我就可以直接计算出这个元素在集合中的位置,根本不需要一次又一次的查找!
举一个例子,假如我的数组A中,第i个元素里面装的key就是i,那么数字3肯定是在第3个位置,数字10肯定是在第10个位置。哈希表就是利用利用这种基本的思想,建立一个从key到位置的函数,然后进行直接计算查找。
3、Hash表在海量数据处理中有着广泛应用。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值