散列表又称为Hash表,是根据关键码值(key-value)而直接进行访问的数据结构。通过散列函数,可以将任意长度的输入变化为固定长度的输出,即散列值,从而直接进行查找。这种转化是一种压缩映射,即样本范围小于存储范围,但样本取值空间大于存储空间。
散列表需要解决两个问题,散列函数的选择和冲突的处理。
散列函数又称为Hash函数,它对不同的输出值得到一个固定长度的消息摘要。常用的散列函数有:
除法散列法: index = value % 16 ;
平方散列法: index = (value * value) >> 28;
斐波那契散列法:对于32位整数: index = (value * 2654435769) >> 28。
冲突处理。当不同的输入样本得到同一个关键码值时,就会产生冲突。一般的冲突解决方法有两种:开放寻址法和拉链法。
开放寻址法在冲突发生时,需要对散列表进行查探,直到将其放入到线性的散列表中。
拉链法在冲突发生时,将统一地址的所有元素放到同一链表中,散列表中存储链表表头指针。拉链法还可以扩展为哈希树进一步提高查找效率。