线性探测解决哈希冲突的哈希表
哈希表是一种不用遍历,可以随机访问元素,实现时间复杂度为O(1)的一种数据结构,大大节省了时间。
一. 哈希表定义
我们一般定义一个数组用来表示一个哈希表的存储元素的空间,并且通过哈希函数来实现确定某个元素的存入位置、查找某个元素、删除某个元素。
哈希函数
我们定义哈希函数,一般采用除整取余法:hash(key) = key % m(m为内存单元个数,可以自己定义)。这里我们定义为10。我们就可以根据该哈希函数计算元素的存储位置:
hash(1) = 1;hash(2) = 2;hash(8) = 8;hash(5) = 5;hash(10) = 0
所以,这组数据存储如下:
这样,我们就可以根据数组下标随机访问我们想要查找的元素,实现时间复杂度O(1)。
这里的每一个下标对应一个元素,就类似于一个中文单词对应有一个英文单词,这个我们叫做键值对。
二. 哈希冲突
利用以上所说的哈希函数来存储元素时,我们可能会遇到取到的余数相同,即存储位置相同。比如说hash(1)=1,hash(11)=1,但是下标为1的位置我们只能存入一个元素,这样的情况就叫做哈希冲突。
为了解决哈希冲突,当然相应的也会有很多办法。其中,我们最常用的有两种:开散列法、闭散列法。
开散列法:每个下标对应的元素不是单纯的只放一个元素,而是存放一个链表,将相同余数的元素当做一个结点都放在链表上。(该方法见另一篇博客开散列实现哈希表)
闭散列法:发生冲突时,若要插入位置已有元素,但是哈希表还有存储位置,就线性向后探测,遇到的第一个可插入元素位置就可以进行操作。(本文即使用该方法实现哈希表)
负载因子:因为使用哈希表的目的是实现时间上的好处,避免了遍历,可以随机访问,使得