定义
散列表是一种通过散列函数将关键字直接定位到value存储的地址的数据结构,从而实现快速的查找
散列函数
- 直接定址法:addr=a*key+b,其中a,b均为常数;定义一个线性函数对key进行映射,这样的哈希方式可以避免冲突,但是对于key分布比较分散的情况比较浪费存储空间
- 取余法:假设散列表长度为n,去小于等于n最大的质因子m,addr=key%m
- 数字分析法:在所有key确定的情况下,分析key对应的二进制数值,分析哪几位二进制位组成的数字分散比较均匀,对这几位二进制位对应的数值进行散列映射
例如这组key值的前八位比较类似,因此可以只对后四位进行哈希映射即可 - 平方取中法:对于散列值较大,key值较小的情况,可以对key进行平方,然后取平方中的几位数字左右哈希值。例如key=521,hash(key)=7144
- 折叠法:对于散列值较小,key值较大的情况,可以对key进行分割,对分割的几个部分取和。例如key=521123,addr=521+12+3
哈希冲突解决方案
- 开放定址法
线性探测法
平方探测法
rehash - 拉链法