面渣逆袭:半个小时成功拿下阿里一面HashMap追魂二十三问

本文深入剖析了HashMap的内部机制,包括数据结构、红黑树的使用、哈希/扰动函数设计、扩容策略以及线程安全性问题。通过实例讲解了HashMap的put和get流程,阐述了为何在冲突解决时选择链表和红黑树,以及为什么链表转红黑树的阈值为8。文章还探讨了HashMap在多线程环境下的问题以及解决方案,如ConcurrentHashMap的实现。此外,对比分析了LinkedHashMap和TreeMap的有序实现,以及HashSet的底层实现。
摘要由CSDN通过智能技术生成

HashMap作为我们熟悉的一种集合,可以说是面试必考题。简单的使用,再到原理、数据结构,还可以延伸到并发,可以说,就一个HashMap,能聊半个小时。

1.能说一下HashMap的数据结构吗?

JDK1.7的数据结构是数组+链表,JDK1.7还有人在用?不会吧……

说一下JDK1.8的数据结构吧:

JDK1.8的数据结构是数组+链表+红黑树。

数据结构示意图如下:

面渣逆袭:半个小时成功拿下阿里一面HashMap追魂二十三问

其中,桶数组是用来存储数据元素,链表是用来解决冲突,红黑树是为了提高查询的效率。

  • 数据元素通过映射关系,也就是散列函数,映射到同数组对应索引的位置
  • 如果发生冲突,从冲突的位置拉一个链表,插入冲突的元素
  • 如果链表长度>8&数组大小>=64,链表转为红黑树
  • 如果红黑树节点个数<6 ,转为链表

2.你对红黑树了解多少?为什么不用二叉树/平衡树呢?

红黑树本质上是一种二叉查找树,为了保持平衡,它又在二叉查找树的基础上增加了一些规则:

  1. 每个节点要么是红色,要么是黑色;
  2. 节点永远是黑色的;
  3. 所有的叶子节点都是黑色的(注意这里说的叶子节点其实是图中的 NULL 节点);
  4. 每个红色节点的两个子节点一定都是黑色;
  5. 从任一节点到其子树中每个叶子节点的路径都包含相同数量的黑色节点;

面渣逆袭:半个小时成功拿下阿里一面HashMap追魂二十三问

之所以不用二叉树:

红黑树是一种平衡的二叉树,插入、删除、查找的最坏时间复杂度都为 O(logn),避免了二叉树最坏情况下的O(n)时间复杂度。

之所以不用平衡二叉树:

平衡二叉树是比红黑树更严格的平衡树,为了保持保持平衡,需要旋转的次数更多,也就是说平衡二叉树保持平衡的效率更低,所以平衡二叉树插入和删除的效率比红黑树要低。

3.红黑树怎么保持平衡的知道吗?

红黑树有两种方式保持平衡:旋转和染色。

  • 旋转:旋转分为两种,左旋和右旋

面渣逆袭:半个小时成功拿下阿里一面HashMap追魂二十三问

面渣逆袭:半个小时成功拿下阿里一面HashMap追魂二十三问

  • 染⾊:

面渣逆袭:半个小时成功拿下阿里一面HashMap追魂二十三问

4.HashMap的put流程知道吗?

先上个流程图吧:

面渣逆袭:半个小时成功拿下阿里一面HashMap追魂二十三问

  1. 首先进行哈希值的扰动,获取一个新的哈希值。(key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
  2. 判断tab是否为空或者长度为0,如果是则进行扩容操作。复制代码if ((tab = table) == null || (n = tab.length) == 0) n = (tab = resize()).length;
  3. 根据哈希值计算下标,如果对应小标正好没有存放数据,则直接插入即可否则需要覆盖。tab[i = (n - 1) & hash])
  4. 判断tab[i]是否为树节点,否则向链表中插入数据,否则向树中插入节点。
  5. 如果链表中插入节点的时候,链表长度大于等于8,则需要把链表转换为红黑树。treeifyBin(tab, hash);
  6. 最后所有元素处理完成后,判断是否超过阈值;threshold,超过则扩容。

5.HashMap怎么查找元素的呢?

先看流程图:

面渣逆袭:半个小时成功拿下阿里一面HashMap追魂二十三问

HashMap的查找就简单很多:

  1. 使用扰动函数,获取新的哈希值
  2. 计算数组下标,获取节点
  3. 当前节点和key匹配,直接返回
  4. 否则,当前节点是否为树的节点,查找红黑树
  5. 否则,遍历链表查找

6.HashMap的哈希/扰动函数是怎么设计的?

HashMap的哈希函数是先拿到 key 的hashcode,是一个32位的int类型的数值,然后让hashcode的高16位和低16位进行异或操作。

复制代码

    static final int hash(Object key) {
        int h;
        // key的hashCode和key的hashCode右移16位做异或运算
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }

这么设计是为了降低哈希碰撞的概率。

7.为什么哈希/扰动函数能降hash碰撞?

因为 key.hashCode() 函数调用的是 key 键值类型自带的哈希函数,返回 int 型散列值。int 值范围为 -2147483648~2147483647,加起来大概 40 亿的映射空间。

只要哈希函数映射得比较均匀松散,一般应用是很难出现碰撞的。但问题是一个 40 亿长度的数组,内存是放不下的。

假如 HashMap 数组的初始大小才 16,就需要用之前需要对数组的长度取模运算,得到的余数才能用来访问数组下标。

源码中的运算就是把散列值和数组长度 - 1 做一个 "与&" 操作,位运算比取余 % 运算要快。

复制代码

bucketIndex = indexFor(hash, table.length);

static int indexFor(int h, int length) {
     return h 
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值