MIT算法导论公开课第八讲全域哈希和完全哈希

一路前行1

于 2017-10-25 15:04:29 发布

阅读量2k

点赞数 1

分类专栏： Algorithm

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weiyongle1996/article/details/78341669

版权

全域哈希通过随机选择哈希函数避免特定键集导致的性能下降，保证平均性能。完全哈希在键值静态时，采用两级哈希确保查询效率，冲突期望不超过1/2。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

全域哈希

对于任意哈希函数而言，都存在一个不好的健集，使得所有的健都会哈希到同一个槽里去，那么如何解决这种情况呢？如何防止对某个键集永远有较差的表现？如何防止竞争对手使用这个键集来降低你的性能表现？一个词解决这个问题 —— 随机！

全域哈希的方法就是随机选择一个哈希函数H（当然不是每次操作都选择一个哈希函数，而是构建一个哈希表的时候随机选一个，选定之后这个哈希表的所有操作都是基于这个哈希函数，这种方法可以防止竞争对手别有用心的设计一个键集，同时也能避免某些键集永远会导致较差的性能，如果是，那么重新建一个表就行！）

定义：设U为键的全域，H是哈希的有限集，H里面的每个哈希函数h将集合U映射到哈希表的m个位置上，如果哈希表满足：对于U里面的两个值x,y x≠y {h∈H：h（x）=h（y）}=|H|/m，那么H就是全域的。
|H|的意思是指全域哈希函数的个数，那么从里面任意取一个函数h，这个函数把x和y哈希到同一个位置的概率就是1/m，也就是说，这些函数都是均匀函数。

定理：用h来将任意n个键哈希到大小为m的表T里，使用链表法解决冲突，如果关键字k不在表中，则关键字k被哈希到其中链表的长度至多为α。

证明：设是表示与key x冲突的键值数量的随机变量，设是指示变量，即

则，

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。