2.
SuRF-Hash(SuRF with Hashed Key Suffixes):针对SuRF-Base有很高的FPR,在将集合中的关键字加入到SuRF-Base树的同时,也会对关键字进行hash计算,将得到的hash值的n个bit存储到最终的value中,当进行关键字的查找时,不仅要在Trie树上面查找,还要对比hash值。这种结构有利于Point查询,且保存的hash值每多一位,做Point quey的FPR就会减少一半。但是这个结构并不会对Range query有任何帮助,不能减少range query的FPR。
3. SuRF-Real(SuRF with Real Key Suffixes):SuRF-Real将存储的hash值的n个bit换成了真实key(即value中存放着key),例如上图的右部分表示添加了8bit的suffixes,这样虽然同时增强了Point query和Range query,但是关键字的区分度还是不高,在point查询下, 它的FPR比SuRF-Hash要高。
SuRF-Mixed(SuRF with Mixed Key Suffixes):为了同时享受Hash和Real两种方式的优点, Mixed模式就是将两种方式混合使用,存储的value中有一部分是real key,另一部分是hashed key,混合的比例可以根据数据分布进行调节来获得最好的效果。如下图是一个案例:
1.
FAST SUCCINCT TRIES是作者提出来的一种对Trie树进行编码的方式,可以减小该树在内存中空间,同时保留了查询的能力