HashMap使用put方法添加数据时底层实现原理解析

猿究院-李佳俊

于 2024-01-25 21:34:56 发布

阅读量956

点赞数 15

文章标签： java 开发语言 jvm

本文链接：https://blog.csdn.net/S1ANS/article/details/135853170

版权

本文详细介绍了HashMap中put方法的工作原理，涉及数据结构（数组、链表、哈希表）、哈希算法的应用以及如何处理插入、查找和扩容操作，包括hashCode()和equals()的使用以及链表转红黑树的过程。

摘要由CSDN通过智能技术生成

简介

常见的数据结构有三种：数组结构、链表结构、哈希表结构，它们的的特点如下所示：
1、数组结构：存储区间连续、内存占用严重、空间复杂度大。

优点：随机读取和修改效率高，因为数组是连续的（随机访问性强，查找速度快）。
缺点：插入和删除数据效率低，因为插入数据时，这个位置后面的数据在内存中都要往后移动，且大小固定不易动态扩展。

2、链表结构：存储区间离散、占用内存宽松、空间复杂度小。

优点：插入删除速度快，内存利用率高，没有固定大小，扩展灵活。
缺点：不能随机查找，每次都是从第一个开始遍历（查询效率低）。

3、哈希表结构：结合数组结构和链表结构的优点，从而实现了查询和修改效率高，插入和删除效率也高的一种数据结构。

hashMap结构图

常见的hashMap就是一种哈希表结构，如下图所示

hashMap中put方法的实现原理

下图所示为put方法的实现流程，详细过程下文将以源码为基础详细展开分析

hashMap源码中重要的成员变量

static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;//初始容量，为16，必须为2的次幂
static final int MAXIMUM_CAPACITY = 1 << 30;//table数组的最大长度
static final int MIN_TREEIFY_CAPACITY = 64;//table数组的最小长度
static final float DEFAULT_LOAD_FACTOR = 0.75f;//当容量被占满0.75时就需要reSize扩容
static final int TREEIFY_THRESHOLD = 8;//链表长度到8，就转为红黑树
static final int UNTREEIFY_THRESHOLD = 6;// 树大小为6，就转回链表

Node是hashMap的一个内部类，实现了Map.Entry接口，本质就是一个映射(键值对) ，源代码如下

 static class Node<K,V> implements Map.Entry<K,V> {
        final int hash;
        final K key;
        V value;
        Node<K,V> next;

        Node(int hash, K key, V value, Node<K,V> next) {
            this.hash = hash;
            this.key = key;
            this.value = value;
            this.next = next;
        }

        public final K getKey()        { return key; }
        public final V getValue()      { return value; }
        public final String toString() { return key + "=" + value; }

        public final int hashCode() {
            return Objects.hashCode(key) ^ Objects.hashCode(value);
        }

        public final V setValue(V newValue) {
            V oldValue = value;
            value = newValue;
            return oldValue;
        }

        public final boolean equals(Object o) {
            if (o == this)
                return true;
            if (o instanceof Map.Entry) {
                Map.Entry<?,?> e = (Map.Entry<?,?>)o;
                if (Objects.equals(key, e.getKey()) &&
                    Objects.equals(value, e.getValue()))
                    return true;
            }
            return false;
        }
    }

put方法源码

public V put(K key, V value) {
        return putVal(hash(key), key, value, false, true);
    }

首先先来了解put方法中hash方法的含义

static final int hash(Object key) {
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }

上图操作是把key与其高16位进行异或得到一个哈希值以便存放进table数组的对应位置

putVal方法是put方法的具体实现，其实现流程如下图所示

// 参数onlyIfAbsent表示是否替换原值
// 参数evict主要用来区别是通过put添加的还是创建时初始化数据
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                boolean evict) {
    Node<K,V>[] tab; Node<K,V> p; int n, i;
    // 空数组，需要初始化
    if ((tab = table) == null || (n = tab.length) == 0)
        // resize()不仅用来调整容量大小，还用来进行初始化配置
        n = (tab = resize()).length;
    //这里就是看下在hash位置有没有元素，实际位置是hash % (length-1)，也就是取余操作
    if ((p = tab[i = (n - 1) & hash]) == null)
        // 将元素直接插进去
        tab[i] = newNode(hash, key, value, null);
    else {
        // 如果对应下标的位置已经有元素就需要添加链表或红黑树
        // e是用来查看是不是待插入的元素已经有了，有就替换
        Node<K,V> e; K k;
        // p是存储在当前位置的元素
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
            e = p; //要插入的元素就是p，这说明目的是修改值
        // p是一个树节点
        else if (p instanceof TreeNode)
            // 把节点添加到树中
            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
        else {
            // 这是链表结构，要把待插入元素挂在链尾
            for (int binCount = 0; ; ++binCount) {
                //没有循环条件可以直接进入循环，且根据需求向后循环
                if ((e = p.next) == null) {
                    p.next = newNode(hash, key, value, null);
                    // 链表比较长，需要树化，
                    // 由于初始即为p.next，所以当插入第8个元素才会树化
                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        treeifyBin(tab, hash);
                    break;
                }
                // 找到了对应元素，就可以停止了
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    break;
                // 继续向后
                p = e;
            }
        }
        // e就是被替换出来的元素，这时候就是修改元素值
        if (e != null) { // existing mapping for key
            V oldValue = e.value;
            if (!onlyIfAbsent || oldValue == null)
                e.value = value;
            // 默认为空实现，允许我们修改完成后做一些操作
            afterNodeAccess(e);
            return oldValue;
        }
    }
    ++modCount;
    // size太大，达到了capacity的0.75，需要扩容
    if (++size > threshold)
        resize();
    // 默认也是空实现，允许我们插入完成后做一些操作
    afterNodeInsertion(evict);
    return null;
}

总结

hashMap在put方法中，使用了hashCode()和equals()方法。当我们通过传递key-value键值对调用put方法时，hashMap使用哈希算法来找出存储key-value键值对的对应索引。如果索引处为空，则直接插入到数组中，否则，判断是否是红黑树，若是，则红黑树插入，否则遍历链表，当链表长度大于8，将链表转为红黑树，转成功之后再插入。

猿究院-李佳俊

关注

15
点赞
踩
19

收藏

觉得还不错? 一键收藏
1
评论
HashMap使用put方法添加数据时底层实现原理解析

hashMap在put方法中，使用了hashCode()和equals()方法。当我们通过传递key-value键值对调用put方法时，hashMap使用哈希算法来找出存储key-value键值对的对应索引。如果索引处为空，则直接插入到数组中，否则，判断是否是红黑树，若是，则红黑树插入，否则遍历链表，当链表长度大于8，将链表转为红黑树，转成功之后再插入。
复制链接

扫一扫