Hash表(哈希表、散列表)

一、基本概念

散列函数:一个把查找表中的关键字映射成该关键字对应的地址的函数,记为Hash(key)=Addr。(地址可以是数组下标,索引,或内存地址等)

冲突:散列函数可能会把两个和两个以上的不同关键字映射到同一地址。(冲突不可避免,所以要设计好的处理冲突的方法。

同义词:发生碰撞的不同关键字为同义词。

散列表:根据关键字直接进行访问的数据结构。散列表是建立在关键字和存储地址之间的一种直接映射关系。

二、hash函数的构造方法

1、直接定址法

直接取关键字某个线性函数值为散列地址,散列函数为

H(key)=a*key+b;

2、除留余数法

假定散列表表长为m,取一个不大于m但接近或等于m的质数p,散列函数为

H(key)=key%p;

3、平方取中法

取关键字的平方值的中间几位作为散列地址。

4、折叠法

将关键字分割成位数相同的几部分,(最后一部分可以短一些)然后取这几个部分的叠加和作为散列地址,这种方法称为折叠法。

三、Hash表大小的确定

  Hash表大小的确定也非常关键,如果Hash表的空间远远大于最后实际存储的记录个数,则造成了很大的空间浪费,如果选取小了的话,则容易造成冲突。在实际情况中,一般需要根据最终记录存储个数和关键字的分布特点来确定Hash表的大小。还有一种情况时可能事先不知道最终需要存储的记录个数,则需要动态维护Hash表的容量,此时可能需要重新计算Hash地址。

四、处理冲突的方法

1、开放定址法

指的是可存放新表项的空闲地址既向它的同义词表项开放,又向它的非同义词表项开放。数学递推公式为

Hi=(H(key)+di)%m

式中,i<=m-1;m为散列表表长;di为增量序列。

线性探测法

平方探测法

再散列法

伪随机序列法

2、拉链法

采用数组和链表相结合的办法,将Hash地址相同的记录存储在一张线性表中,而每张表的表头的序号即为计算得到的Hash地址。拉链法适用于经常进行插入和删除的情况。



  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值