哈希的缺陷
对于任意的哈希函数而言,都存在一个不好的键集,使得所有键值都会哈希映射到同一个槽中。
- 解决方案:
随机选择哈希函数,使其与输入哈希运算的键值情况相独立。
全域哈希(universal hashing)
定义:设U为键值的全域,H为哈希函数的一个有限集,H的哈希函数将U的键映射到哈希表的槽
{0,1,2,…,m-1}里,并且满足:
对任意的x、y∈U,且x≠y,|{h∈H,h(x)=h(y)}|=|H|/m
从另一个角度看,如果哈希函数h是随机的从函数H里选出的,那么x和y发生碰撞的几率为1/m。
- 在哈希函数集H中,随机的选择函数h,假设我们要将n个键放入T表的m个槽里,对于给定的键x,它发生碰撞的期望次数E[#collision]小于n/m(load factor α)。
- 证明过程如下:
构造全域哈希函数: