HashTable
key-value对应的关联抽象数据类型
功能:
1.可以用作数据库中基本存储
2.可用作数据结构,来查询计划中执行不同的关系运算符
3.可用作索引加速查询处理
使用hash function存入bucket(桶)
分类:
静态哈希表
对于可变长度元素,数组保存指向元素的指针
每个元素都有个块
问题:
需要提前知道元素数
每个key都是独一无二的
hash function要好
chained Hashing
对于每一个块用链表相连
通过把相同哈希值放入同一个bucket解决冲突问题
如果桶满了,再链表后再加一个bucket
会变得非常大
为了处理并发,需要在每一个bucket放上latch
重复key的解决方法
1.单独的链表:将值存储在单独的存储区域中
2.存储在桶中:将重复的密钥存储在相同的存储桶中(使用密钥存储值)
Cuckoo Hashing
首先,有两个数组,采用hash1(),hash2()
对于X,Y,Z…等值,先计算其hash1(),放入相应数组,
1.hash1()计算后,如果放入数组的时候,该位置存在数据,
2.则用hash2(),放入相应位置
3.如果还存在数据,则把原数据踢出去,让原数据重新hash function(),找位置
4.如果我们找到一个循环,那么我们可以使用新的散列函数重建整个散列表
Linear Hashing
图片来源:https://15445.courses.cs.cmu.edu/fall2017/slides/08-hashtables.pdf