一、简介
将任意长度的数值以某个映射规则映射为固定长度的数值,这个过程称为Hash,而这个映射规则被称为Hash函数,而对这个key、value进行存储的数据结构被称为Hash表。
由于通过key的hash映射直接得到了内存地址,所以hash查找的时间复杂度是O(1),但也因此开辟了hash表的内存空间,属于用空间换取时间
的典型例子。
如果不同的key经过hash函数的映射到了同一个位置,这个情况就是hash冲突了,虽然有了冲突就要解决,但是选取一个好的hash函数,使得映射的位置分布均匀
也是很重要的。
二、解决Hash冲突
举例:
arr=[4,6,9,14]
hash函数(一般为取模函数,模选取某个质数) h = n%5
很明显4与9,14冲突了。
1.开放定址法
这个地址冲突了,给它换个地址。
①线性探测再散列
这个位置冲突了,直接向后挪动一位,如果后面一位也冲突了,继续向后挪动。
②二次探测再散列
这个位置冲突了,第一次向后挪动一位,第二次挪动4位,第三次挪动9位,第n次移动第n^2位。
③伪随机数再散列
这个位置冲突了,每次移动的数是个随机数。
2.rehash
构造多个hash函数,对于第一次hash冲突的值再进行hash计算。
还是上面的例子,对于冲突的4,9,14还可以构造一个hash函数 h1=n%7
3.链表法
即冲突的元素不再往左右挪动了,而是以链表的形式存在。(HashMap就是采用这种方式,具体方式以后再写博客记录)
4.建立公共溢出区
即将hash表拆分为两个表,基本表和溢出表,溢出的值全部放在溢出表中