哈希表简述,不包含代码实现
哈希表所需基础知识
- 数组
- 指针
- 链表
- 模运算(%)
哈希表的数据存储结构
使用哈希表进行数据存储,本质上是使用数组+链表的方式进行存储。可以这么理解,数组中存储的是一个个链表的头指针。
详细情况会在后面介绍哈希表构造方式时介绍。
哈希表是什么
前面讲到,哈希表就是利用数组和链表进行存储数据,那什么样的数组+链表可以被称作哈希表呢?
哈希表 = hash函数 + 数组(+链表)
so,什么是hash函数(也可以成为hash算法)?
如果想要专业的解释,请查看百度百科。在这里我就讲一点我的理解。
hash函数的形式
举一个简单的例子,h(key) = key%7,这个函数很容易看懂,就是对输入的变量取关于7的模。而hash函数就是一系列取模的函数。
hash函数的作用
hash的意译是散列,音译是哈希,作用就是对数据进行分类,比如上面的h(key) = key%7 这个函数,就把所有输入的key分成了7组。
那你可能会想到,如果一组数据中,有两个数据取模之后的值一样怎么办?这就是我们下面要讲的,哈希值冲突。
哈希值冲突
什么是哈希值冲突?
前面说过了,就不再赘述。
怎么解决哈希值冲突?
- 链表法
所谓链表法,就是在数组中存储一条条链表的头指针,产生哈希值冲突的时候,就直接添加到链表的末尾就好了。 - 开放地址法
a. 线性探测法
产生冲突之后,去数组下一个位置,看看是不是空的。比如在下标为4的地方冲突了,看看5是不是空的,如果不是,再去看6,直到找到一个空的位置。
b. 平方探测法
产生冲突之后,第一次去下一个位置,第二次去向后数22的地方看看是不是空的。还是以 h(key) = key%7 这个函数为例,如果在1产生了冲突,先去2看看,不为空就去5看看,还不为空就去3看看(数组循环)……
c. 双哈希
h1(key) = key%7
h2(key) = 5 - (key%5)
h2是只在产生冲突的时候使用,比如一个数据块的key是2,存储这个数据的时候在2这里产生了冲突,那么向下找5 - (key%5) = 3个位置,在5这里看看是不是可以存储,如果不行,就向下找2*3 = 6个位置,去1这里……
注意,h2的模要比h1小,并且选的***取模数字一定是质数***