散列表(哈希表)

散列是什么?

散列表的实现叫做散列,散列是一种用以常数平均时间来执行查找、插入和删除的的技术。但是,需要元素之间任何排序信息的树操作是不行的。

所以散列表适合数据量很大,但是不对数据之间排序有要求的情况。

一、散列函数

散列表的查找有两个基本工作:

1.计算位置:通过散列函数,确定关键词的储存位置

2.解决冲突:应用某种策略解决多个关键字位置相同的问题

每个关键字被映射到0到Tablesize-1这个范围中的某个数,并且放到一个适当的表中,这个过程中的这个映射就是散列函数。

1.1散列函数构造方法

关键字是数字的

1.直接定址法

 

2.除留余数法

3.数字分析法

4.折叠法

5.平方取中法

关键字是字符串的

1.移位法

二、解决冲突的方法

2.1分离链接法

做法就是将散列同一个值的所有元素保留到一个表中。由数组和链表共同完成的。在插入操作时(Insert),插入的如果是一个新的元素会被放在链表的最前面,这不仅是插入方便,而且新近插入的元素往往不久就会再次访问。

这里引入一个定义:装填因子(load factor)\lambda:散列表中元素的个数和表的大小之比。散列表的大小其实不重要,最主要的是装填因子的大小。分离链接法的一般需要让\lambda \approx 1即表的大小与预装的元素个数基本相等。

2.2开放定址法

1.线性探测

线性探测法解决冲突的方法就是f(i)=i,每次递增1来寻找空的位置,直到找到新的位置为止。这种方法呢虽然较为简单,但花费的时间多并且容易造成“一次聚集”(primary clustering)

2.平方探测

解决冲突的方法就是f(i) = \pm i^{2},也可能会引起“二次聚集”

3.双散列

解决冲突的方法是 f(i) = i * hash_{_{2}}(x),这里就引入第二个散列函数,通过函数来寻找下一个空的位置。一般hash_{2}(x) = R-(x mod R)  ,这里的R为小于Tablesize的素数。

4.再散列

当散列表中的元素过多,即装填因子\alpha过大,一般来说取0.5\leq \alpha \leq 0.85。这时候我们需要加倍扩大散列表,并且要将其中原来放置的元素全部重排。

三、不同处理冲突方法的平均查找长度(AVL)

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值