哈希表:是一种以键值对(K-V)来存储数据的结构,只要输入要查找的键(key),即可查找到对应的值。将键作为索引,这样就可以快速访问任意键的值。
哈希函数:将哈希表中的关键字映射为元素存储位置的函数。
哈希表中的元素是由哈希函数决定的。将数据元素的关键字K作为自变量,通过一定的函数关系,计算出的值,即为该元素的存储位置。
一个合适的哈希函数具备一下两点:
- 均匀性:K的值均匀分布在哈希表中
- 简单:提高地址计算的速度
哈希冲突:不同的值,经过相同的哈希函数映射后,得出的哈希值可能相同。
解决哈希冲突:
-
闭散列
从发生哈希冲突的位置开始,找下一个"空位置"
-
线性探测:逐个按着往后比较
哈希表中的元素越多,则发生哈希冲突的概率不断提升,当哈希表中元素到达一定程度时,需要扩容处理。
负载因子:70%左右
优点:解决哈希冲突的方式简单
缺点:导致数据堆积–一个冲突会引起一脸篇冲突
-
二次探测
假设第一次计算出来的哈希地址为H0,则发生冲突后,第i次探测时的哈希地址为:H(i)=H0+i^2.
优点:解决了线性探测导致的数据堆积
缺点:如果表格中空位置较多,可能需要探测多次
负载因子:60%左右
-
-
开散列(链地址法)
将每个哈希表的节点当作一个链表的头部或者树得根节点,将所有发生哈希冲突得元素放在一个链表中。
的节点当作一个链表的头部或者树得根节点,将所有发生哈希冲突得元素放在一个链表中。