算法导论小结(5)-散列表

intrepyd

于 2009-07-18 16:24:00 发布

阅读量5k

点赞数

分类专栏：算法导论文章标签：算法 table null delete 存储 search

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/intrepyd/article/details/4359818

版权

By: 潘云登

Date: 2009-7-18

Email: intrepyd@gmail.com

Homepage: http://blog.csdn.net/intrepyd

Copyright: 该文章版权由潘云登所有。可在非商业目的下任意传播和复制。

对于商业目的下对本文的任何行为需经作者同意。

写在前面

1. 本文内容对应《算法导论》(第2版)》第11章。

2. 主要介绍了散列表的基本概念、散列函数的选择，以及两种解决碰撞的方法（链接法和开放寻址法）。

3. 希望本文对您有所帮助，也欢迎您给我提意见和建议。

4. 本文包含以下内容：

² 散列表的基本概念

² 散列函数

² 解决碰撞的方法

² 完全散列

² 链接法和线性探测实现的散列表

散列表的基本概念

假设某应用要用到一个动态集合，其中每个元素都有一个属于[0..p]的关键字，此处p是一个不太大的数，且没有两个元素具有相同的关键字，则可以用一个数组[p+1]存储该动态集合，并且使用关键字作为数组下标进行直接寻址。这一直接寻址思想在前面的非比较排序中就有所应用。然而，当p很大并且实际要存储的动态集合大小n<<p时，这样一个数组将浪费大部分空间。

散列表(Hash table)，使用具有m个槽位的数组来存储大小为n的动态集合。α=n/m被定义为散列表的装载因子。在散列表中，具有关键字k的元素的下标为h(k)，即利用散列函数h，根据关键字k计算出槽的位置。散列函数h将关键字域[0..p]映射到散列表[0..m-1]的槽位上，这里，m可以远小于p，从而缩小了需要处理的下标范围，并相应地降低了空间开销。散列表带来的问题是：两个关键字可能映射到同一个槽上，这种情形称为碰撞。因此，散列函数h应当将每个关键字等可能地散列到m个槽位的任何一个中去，并与其它关键字已被散列到哪一个槽位中无关，从而避免或者至少最小化碰撞。

多数散列函数都假定关键字域为自然数集。如果所给关键字不是自然数，则必须有一种方法将它们解释为自然数。这里，介绍三种主要的散列函数：

l 除法散列法：通过取k除以m的余数，来将关键字k映射到m个槽的某一个中去，即散列函数为

h(k) = k mod m

当应用除法散列法时，要注意m的选择，这也是除法散列法的主要缺点。m不应是2的幂，因为如果m=2^p

最低0.47元/天解锁文章

关注

0
点赞
踩
9

收藏

觉得还不错? 一键收藏
4
评论
算法导论小结(5)-散列表

By: 潘云登Date: 2009-7-18Email: intrepyd@gmail.comHomepage: http://blog.csdn.net/intrepydCopyright: 该文章版权由潘云登所有。可在非商业目的下任意传播和复制。对于商业目的下对本文的任何行为需经作者同意。写在前面
复制链接

扫一扫

专栏目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。