散列表是可以实现字典操作(INSERT、SEARCH和DELETE)的一种有效数据结构,是普通数组概念的推广,把关键字k映射到槽h(k)上的过程称为散列,多个关键字映射到同一个数组下标位置称为冲突,好的散列函数应使每个关键字都等可能地散列到m个槽位中,以上即为本章介绍的主要内容。
直接寻址表
直接寻址表也即是数组,其中每个位置称为槽,一个槽对应一个关键字,是一种简单而有效的技术,但有一个明显的问题:若域U很大,要在机器中存储大小为|U|的一张表T就有点不切实际,且当实际要存储的关键字集合K相对数组的域U来说小时,分配给数组的大部分空间都要浪费掉。
散列表
在直接寻址方式下,具有关键字k的元素被存放在槽k中,而在散列方式下,该元素处于h(k)槽中,也就是说可以利用散列函数h,根据关键字k计算出槽的位置,散列函数h将关键字域U映射到散列表T[0…m- ]的槽位上。
实际上,两个关键字可能映射到同一个槽上,这种情形称为冲突,为了解决冲突,主要从两方面考虑,通过精心设计的随机散列函数来尽量减少碰撞以及解决冲突的方法。
链接法是最简单的冲突解决方法,在该方法中,把散列到同一槽中的所有元素都放在一个链表中,如下图所示: