查看原文:http://www.dullgull.com/2012/05/cuckoo-hash-%e5%b8%83%e8%b0%b7%e9%b8%9f%e5%93%88%e5%b8%8c/
布谷鸟哈希最早于2001+年由Rasmus+Pagh+和Flemming+Friche+Rodler+提出。该哈希方法是为了解决哈希冲突的问题而提出,利用较少计算换取了较大空间。名称源于该哈希方法行为类似于布谷鸟在别的鸟巢中下蛋,并将别的鸟蛋挤出的行为。它具有占用空间小、查询迅速等特性,可用于Bloom+filter+和内存管理。
+
算法描述
+
算法使用hashA+和hashB+计算对应key+的位置。
+
+
当两个哈希任意位置为空,则选择一个位置插入
+
让两个哈希有位置为空时,则插入到空位置
+
当两个哈希位置均不为空时,随机选择两者之一的位置上keyx+踢出,计算踢出的keyx+另一个哈希值对应的位置进行插入,转至2执行(即当再次插入位置为空时插入,仍旧不为空时,踢出这个keyy)
+
图例
+
1.+插入key1+两个位置均为空,则插入任意位置.
+
+
2.+插入后
+
+
3.+插入key2+两个位置有一个位置为空,则插入空的位置中
+
+
4.+插入后效果
+
+
5.+新插入keyi+发现对应两个位置均被占据
+
+
+
6.+随机选择一个位置提出所在位置的key(key1),将踢出的key+放置在另一个哈希结果对应的位置上
+
+
7.+如果踢出的key(key1)又占据/踢出了其他key(keyj)的位置,则反复执行上面的过程直到结束
+
+
其他
+
+
Cockoo+hash+有两种变形。一种通过增加哈希函数进一步提高空间利用率;另一种是增加哈希表,每个哈希函数对应一个哈希表,每次选择多个张表中空余位置进行放置。三个哈希表可以达到80%+的空间利用率。
+
Cockoo+hash+的过程可能因为反复踢出无限循环下去,这时候就需要进行一次循环踢出的限制,超过限制则认为需要添加新的哈希函数。
+
在SOSP+11+的SLIT+文章中有使用Cockoo+hash。
+
增加哈希表过程如下:
+
当新插入一个key+hashA+在上面哈希表位置和hashB+在下面哈希表的位置分别被key1+和keyx+占据,任选一个key+提出(这里选择key1)。
+
+
计算key1+hashB+的值然后插入到下面的hashB+对应的哈希表中。
+
+
+
PS
+
文中图使用graphviz+绘制,图例第七张图片生成文件如下:
+
+
+++1:+digraph+G+{
+++2:+"node0"+[
+++3:+label+=+"null+|+null+|+keyi+|+null+|+null+|+key1+|+key2+|+......"
+++4:+shape+=+"record"
+++5:+];
+++6:+
+++7:+"node2"[
+++8:+label="key1"
+++9:+];
++10:+
++11:+"node3"[
++12:+label="key2"
++13:+];
++14:+
++15:+"node1"[
++16:+label="keyi"
++17:+];
++18:+
++19:+"node1"->"node0":f2[color="red",shape="record",label="hashA"];
++20:+"node1"->;"node0":f6[color="red",shape="record",label="hashB"];
++21: +
++22:+"node0":f2->;"node2";
++23:+"node0":f5->;"node2"[style="dotted"];
++24: +
++25:+"node0":f2->;"node3"[style="dotted"];
++26:+"node0":f6->;"node3";
++27: +
++28:+"node0":f5:s->;"node0":f7:s[color="blue",shape="record",label="keyj"];
++29:+}
在GVEdit+在使用的时候,F5+是生成图片,并在对应的目下生成了响应的图形文件,相关设置在Graph+setting+里面,第一次用的时候总是找不到export+image+的方法,总导出不了对应图片。