哈希(散列)详解

散列表(也叫哈希表),是根据关键字值而直接进行访问的数据结构。

通过把关键字值映射到表中一个位置来访问记录,以加快查找的速度。这个映射函数叫做散列函数,存放记录的数组叫做散列表。

散列函数的构造方法: 
(1)直接定址法 
(2)除留余数法 
(3)平方取中法 
(4)折叠法 
(5)数值分析法

本文采用除留余数法构造散列函数。 
H(K) = (H(k) + i) % m; 其中i = 1, 2, …, m为哈希表大小。

构造散列函数的目的是减少冲突,但要完全避免冲突是不可能的,只能尽可能减少冲突。 
处理冲突的方法: 

  1. 开放定址法  
  2. 再哈希法 
  3. 链地址法(拉链法)
  4. 建立公共溢出区
     

开放定址法:

  • 线性探查法:H(K) = (H(k) + i) %d   每次+1,一次循环查找。缺点:容易造成聚集现象
  • 平法探查法:H(K) = (H(k) + i^{2}) %d  每次加i^{2} ,避免了线性探查的聚集现象,缺点:不能探查到散列表的所有单元,但至少可以探查到散列表的一半单元。

根据原始数组建立一个哈希表,哈希表也为一个数组,且要求哈希表有固定大小。 
本文采用开放定址法处理冲突 ,线性探查法。
当由H(k)算出的位置不为空时,则通过已经构造的散列函数来寻找新的空位置。 
从H(k)开始往后逐个搜索空位置,如果后面没有空位置,则从头开始搜索,直到搜索到空位置,或者回到H(k)停止搜索。(回到H(k)则说明搜索失败)

举例:取H(K) = (H(k) + i) %11,将关键字序列20, 30, 70, 15, 8, 12, 18, 63, 19存储到哈希表中,如下图:

平均搜索长度可以用来衡量一个搜索算法,在上图中有: 
平均查找长度 = (1 x 5 + 2 x 1 + 3 x 1+ 4 x 1+ 5 x 1)/ 9 = 19/9
 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值