散列表学习总结

最新推荐文章于 2022-09-28 20:41:15 发布

小思斯

最新推荐文章于 2022-09-28 20:41:15 发布

阅读量382

点赞数

分类专栏：数据结构

本文链接：https://blog.csdn.net/weixin_40522909/article/details/105030264

版权

数据结构专栏收录该内容

3 篇文章 0 订阅

订阅专栏

散列思想

散列表利用数组支持下标随机访问的特性，作为数组plus。.

装载因子

散列表的装载因子 = 填入表中的元素个数 / 散列表的长度
散列碰撞攻击原理：恶意攻击者输入恶意制作的数据，使得所有数据经过散列函数后都到一个桶里，如果解决冲突的办法是链表法，此时散列表就会退化成链表，查询时间复杂度急剧下降。最后有可能导致因为查询而消耗大量CPU以或线程资源，导致系统无法响应其他请求，从而达到了拒绝服务攻击的目的（DOS)；
![在这里插入图片描述](https://img-blog.csdnimg.cn/20200322165332214.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MDUyMjkwOQ==,size_16,color_FFFFFF,t_70

当散列表的装载因子超过某个阈值时，要进行扩容。装载因子的阈值设置要权衡时间、空间复杂度。如果内存空间不紧张，对执行效率要求很高，可以降低负载阈值；相反，如果内存空间紧张，对执行效率要求不高，可以增加负载因子的值，甚至可以大于一。

扩容

避免低效地扩容当装载因子已经达到阈值时，需要先进行扩容，再插入数据。扩容分为两步，一是申请空间，二是搬移数据。一次性扩容耗时过多，我们可以将搬移数据穿插在插入过程中，分批完成。当新数据插入时，我们将新数据插入到新的散列表中，并且从老的散列表中取一个数据放入到新的散列表。重复多次后旧散列表中的数据就一点点全部搬到新散列表中了。查找时，先在新的散列表中查找，再在旧的散列表中查找。
java中LinkedHashMap采用了链表解决冲突，ThreadLocalMap是通过线性探测的开放寻址法来解决冲突。

开放寻址法*

*线性探测和平方探测等等
*

优点

*数据存储在数组中，可以有效地利用CPU缓存加快查询速度
序列化比较容易；

缺点

删除数据时麻烦，需要做标记；所有数据都存在一个数组，冲突代价更高因此，装载银子不能过大，所以比较浪费内存空间

总结
数据量较小、装载因子小时适合采用开放寻址法。

链表法

优点

内存利用率高。因为需要就创建，开放寻址需要提前申请好。（也就是链表的优点）
对大装载因子的容忍度跟高。开放寻址法只适用于装载因子小于1的情况。接近1时都可能会有大量的散列冲突，导致大量的探测、再散列等。而链表法，只要散列函数的值随机均匀，即便是装载因子编程10，也只是链表变长，查找效率即使下降，也比顺序查找快。

缺点

事实上指针的存储时比较消耗内存的。再者，链表中的结点零散分布在内存中，***不连续，对CPU缓存***不友好，也会影响执行效率。
不过如果是大对象，对象远大于指针（4个字节或者8个字节的大小），那链表中指针的内存消耗就可以忽略啦。

优化
链表法中的链表可以替换为其他的高效的数据结构，比如跳表、红黑树。这样即便所有数据都散列到一个坐标下，最终退化的散列表的查找时间也不过是O(logn)。这个优化可以抵御散列碰撞攻击。

总结
链表法适合存储大对象、大数据量的散列表，比起开放寻址法，它更加灵活，支持更多的优化策略。

工业级散列表举例

HashMap

初始大小
默认是16，可以修改初始值大小
装载因子和动态扩容
阈值默认0.75，超过0.75*capacity时，启动自动扩容，每次扩容两倍。
散列解决冲突的办法
底层时链表法，jdk1.8之后引入了红黑树，当链表长度>8时，链表转换为红黑树。还可利用红黑树快速增删改查的特点，提高HashMap的性能。当红黑树结点个数小于8时，红黑树又会转化为链表。CAUSE红黑树在节点数量较小时维护平衡，比起链表，性能优势并不明显。
** 散列函数**

int hash(Object key) {
    int h = key.hashCode()；
    return (h ^ (h >>> 16)) & (capicity -1); //capicity 表示散列表的大小
}

public int hashCode() {
  int var1 = this.hash;
  if(var1 == 0 && this.value.length > 0) {
    char[] var2 = this.value;
    for(int var3 = 0; var3 < this.value.length; ++var3) {
      var1 = 31 * var1 + var2[var3];
    }
    this.hash = var1;
  }
  return var1;
}