JDK1.8 HashMap实现原理与解析(部分)

前言

今天我们了解一下HashMap,关于HashMap,网上已有很多资料,这里我尝试以自己的理解、以尽可能简单且容易理解的方式重述一遍。表述不当的地方欢迎大家指正。

HashMap属性和JDK1.8新特性

结构

数组+链表(JDK1.8之前)

数组+(链表/红黑树)(JDK1.8新特性)

如上图

上面为数组 数组存储链表的头节点(浅绿)、红黑树的根节点(浅红)以及灰色的null

实际上,在数组达到需要扩容的阈值时,还是会有null。这是因为,为了避免哈希冲突,HashMap采用了拉链法即把冲突的键值对放到相应数组位上形成一个链表,每多一次冲突,链表尾部就会新增一个键值对实体(JDK1.8中,当链表长度大于等于8时,链表将被转化为红黑树)。

基本属性

默认初始容量 DEFAULT_INITIAL_CAPACITY=16

如果没有指定初始容量,将使用此初始容量。

*这里的容量在初始化时与数组容量相等,然而在判断是否需要扩容时(包括取用Map的size()时),所取用的HashMap大小实际是链表和红黑树中所有的键值对实体(Entry)而不是数组中的非空元素。

负载因子 loadFactor =DEFAULT_LOAD_FACTOR=0.75(默认)

当数组新加入元素后size(红色字体提到的所有键值对总数)大于负载因子和容量的乘积(阈值,源码中称为threshold),则扩容(容量变为二倍)。

 static final int TREEIFY_THRESHOLD = 8;//数组位对应的数据结构变为树的阈值

 static final int UNTREEIFY_THRESHOLD = 6;//数组位对应的数据结构变回链表的阈值

如结构中所表达的,在对HashMap进行增删操作时,数组位置对应的数据结构是有可能会发生变化的。

知识补充

HashMap如何通过hash算法取到数组下标(或者说为什么HashMap的容量要是2的整数幂)

(n-1)&hash        //n为数组容量,hash为哈希值

由于HashMap规定,数组容量只能是2的整数幂,那么n-1的表示就很明确了——数值大小刚好是数组的最大下标,二进制表示是低位全部为1,高位全部为0,这样的数和32位的hash去与,显然就是保留了hash的低位作为数组下标,这样hash算法的随机性可以保证数组的任意位置都有可能被取到,同时也保证了不会发生数组越界。

如:hash  =  0b1011 1111 1111 0101 1101 0011 0011 1100

       n=16=0b 1 0000

       n-1=0b    0 1111

     hash&(n-1)=00000000000000000000000001100        (只保留了后四位)

HashMap的哈希算法

    static final int hash(Object key) {
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }

这是HashMap中计算hash的方法,可以注意到,非空情况下,返回的是(h=key.hashCode()) ^ (h >>> 16)。

为什么这样做呢?答案是:减少哈希碰撞。

hashCode的取值是在整个int范围内变化的,那么就会有类似这样一种哈希碰撞的情况:两个对象的hashCode低位完全相等,但是高位却相差很多,按照上面hash映射到数组的方法,这两个对象是极有可能映射到同一个数组下标的。要解决这个问题,就要让高位参与运算,检查两个二进制数的差异性,异或无非是最好用的方法,这个语句做的是这件事。

 

 

插入新键值对

 public V put(K key, V value) {
        return putVal(hash(key), key, value, false, true);
    }

 final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;//判断数组是否为空,为空则重新初始化
        if ((p = tab[i = (n - 1) & hash]) == null)//根据哈希值计算出数组下标
            tab[i] = newNode(hash, key, value, null);//如果位置为空则新建键值对节点
        else {//当前的位置不为空
            Node<K,V> e; K k;
            if (p.hash == hash &
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;//如果是同一个key,那么直接覆盖掉当前节点的Value,完成插入
            else if (p instanceof TreeNode)//是红黑树节点,交给树节点的插入方法处理
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {//是链表节点
                for (int binCount = 0; ; ++binCount) {
                    if ((e = p.next) == null) {//没找到需要的Key,新建
                        p.next = newNode(hash, key, value, null);
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                    }
                    if (e.hash == hash &&//找到了需要的Key,退出循环,后面的代码负责放入Value
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;//放入新的Value
                afterNodeAccess(e);
                return oldValue;//放回旧的Value
            }
        }
        ++modCount;
        if (++size > threshold)//超出阈值,扩容
            resize();
        afterNodeInsertion(evict);
        return null;
    }

 

扩容的问题

如上篇所表达的,当size大于阈值时,数组会进行扩容。所谓扩容,实际就是把原有结构中的所有结点数据转移到新的容量更大(2倍原始容量)的数组中。关于扩容的实现方法,网上的帖子很多很全,也写的很详细,这里就不再赘述。

主要介绍一下扩容中遇到的一个问题,以及如何解决。

扩容中数组容量变成了原来的2倍,而上面提到,数组下标的计算是(n-1)*hash,由此可推知以下问题:

 

那么如何重新分配节点呢?

首先我们肯定会想到哈希函数:重新hash()一下不就可以了吗?但事实并非这样,因为这个时候节点的指针会发生变化,所以重新hash()后得到的哈希值并不一定和原来一样,那么如果想拿原来的key来找value,几乎是不可能的,而不变的,就只有节点初始化时存入的hash常量(源码中它是final的)

因此,我们只能利用节点对象中的hash常量来进行重新分配空间,保证用原来key的hash值还能拿到对应的节点

查看源码的resize(),发现了这样一句语法:

当需要转移该元素,进行这样的判断。实际上判断中的语句是取了多出来的那个hash最高位,如果最高位是0,那么loTail就是这个节点,hiTail则为空,否则相反,这两个变量又会参与下面的判断。

紧接着,下面的语句又进行了操作:

显然可以推出,对于最高位是0的情况,放到 j 的位置,而对于最高位是1的情况,放到 j + oldCap的位置。

为什么是 j +oldCap(原数组容量)呢?如下图所示:

可以看到,最后两个节点所放的位置分别对应上了他们的hash所对应的数组下标,问题解决

 

 

以上是本篇文章全部内容,欢迎大家观摩指正。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
【优质项目推荐】 1、项目代码均经过严格本地测试,运行OK,确保功能稳定后才上传平台。可放心下载并立即投入使用,若遇到任何使用问题,随时欢迎私信反馈与沟通,博主会第一时间回复。 2、项目适用于计算机相关专业(如计科、信息安全、数据科学、人工智能、通信、物联网、自动化、电子信息等)的在校学生、专业教师,或企业员工,小白入门等都适用。 3、该项目不仅具有很高的学习借鉴价值,对于初学者来说,也是入门进阶的绝佳选择;当然也可以直接用于 毕设、课设、期末大作业或项目初期立项演示等。 3、开放创新:如果您有一定基础,且热爱探索钻研,可以在此代码基础上二次开发,进行修改、扩展,创造出属于自己的独特应用。 欢迎下载使用优质资源!欢迎借鉴使用,并欢迎学习交流,共同探索编程的无穷魅力! 基于业务逻辑生成特征变量python实现源码+数据集+超详细注释.zip基于业务逻辑生成特征变量python实现源码+数据集+超详细注释.zip基于业务逻辑生成特征变量python实现源码+数据集+超详细注释.zip基于业务逻辑生成特征变量python实现源码+数据集+超详细注释.zip基于业务逻辑生成特征变量python实现源码+数据集+超详细注释.zip基于业务逻辑生成特征变量python实现源码+数据集+超详细注释.zip基于业务逻辑生成特征变量python实现源码+数据集+超详细注释.zip 基于业务逻辑生成特征变量python实现源码+数据集+超详细注释.zip 基于业务逻辑生成特征变量python实现源码+数据集+超详细注释.zip
提供的源码资源涵盖了安卓应用、小程序、Python应用和Java应用等多个领域,每个领域都包含了丰富的实例和项目。这些源码都是基于各自平台的最新技术和标准编写,确保了在对应环境下能够无缝运行。同时,源码中配备了详细的注释和文档,帮助用户快速理解代码结构和实现逻辑。 适用人群: 这些源码资源特别适合大学生群体。无论你是计算机相关专业的学生,还是对其他领域编程感兴趣的学生,这些资源都能为你提供宝贵的学习和实践机会。通过学习和运行这些源码,你可以掌握各平台开发的基础知识,提升编程能力和项目实战经验。 使用场景及目标: 在学习阶段,你可以利用这些源码资源进行课程实践、课外项目或毕业设计。通过分析和运行源码,你将深入了解各平台开发的技术细节和最佳实践,逐步培养起自己的项目开发和问题解决能力。此外,在求职或创业过程中,具备跨平台开发能力的大学生将更具竞争力。 其他说明: 为了确保源码资源的可运行性和易用性,特别注意了以下几点:首先,每份源码都提供了详细的运行环境和依赖说明,确保用户能够轻松搭建起开发环境;其次,源码中的注释和文档都非常完善,方便用户快速上手和理解代码;最后,我会定期更新这些源码资源,以适应各平台技术的最新发展和市场需求。
LinkedHashMap 是继承自 HashMap 的类,在 HashMap 的基础上通过维护一条双向链表来解决无法保持遍历顺序和插入顺序一致的问题,并提供了对访问顺序的支持。在 JDK 1.8 版本中,LinkedHashMap 使用了和 HashMap 相同的底层数据结构,即拉链式散列结构,并在解决长链表问题上引入了红黑树优化。这样,LinkedHashMap 可以提供高效的增删改查操作,并且在遍历时可以按照插入或访问的顺序进行遍历。 LinkedHashMap 的底层数据结构和 HashMap 一样,都是使用数组加链表或红黑树的方式来处理冲突。每个数组元素都是一个链表或红黑树的头节点,每个节点包含一个键值对。当插入或查找元素时,根据键的哈希值找到对应的数组下标,然后在链表或红黑树中进行操作。 在 LinkedHashMap 中,除了继承了 HashMap方法,还覆写了部分方法来维护双向链表。具体来说,LinkedHashMap 在 put、remove 和 get 等方法中添加了对双向链表的操作,以保证插入和访问的顺序。当插入一个新的元素时,LinkedHashMap 会将该元素插入到链表的末尾;当访问一个已有元素时,LinkedHashMap 会将该元素移动到链表的末尾。通过这种方式,LinkedHashMap 可以保持元素的插入或访问顺序,实现了有序遍历的效果。 总结起来,LinkedHashMap 的底层原理是在 HashMap 的基础上通过维护一条双向链表来实现插入和访问的顺序,而在 JDK 1.8 中,LinkedHashMap 使用了和 HashMap 相同的底层数据结构,即拉链式散列结构,并引入了红黑树优化。这样,LinkedHashMap 可以提供高效的增删改查操作,并且在遍历时可以按照插入或访问的顺序进行遍历。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [LinkedHashMap(JDK1.8)源码解析](https://blog.csdn.net/qq_41242680/article/details/114637171)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值