HashMap

m0_54063422

已于 2023-07-01 16:09:35 修改

阅读量77

点赞数

文章标签： java 开发语言

于 2023-06-22 17:25:06 首次发布

本文链接：https://blog.csdn.net/m0_54063422/article/details/131340593

版权

3）构造方法，注意：HashMap只有在put的时候才会进行初始化

4）tableSizeFor方法

5）put方法

6）hash值的计算与put对象插入位置的计算

7）resize方法

8）红黑树的数据迁移

9）树化：treeifyBin()，treeify(), untreeify()

一、HashMap简介

HashMap是基于哈希表的 Map 接口的实现。它还实现了Serialiable接口，因为存储数据的变量被transient修饰，所以它和ArrayList一样重写了writeObject方法和readObject方法。

HashMap以键值对的方式来存储数据，根据键的hashCode值存储数据，具有很快的访问速度，最多允许一条记录的键为 null，线程不安全的。

HashMap是无序的，它不会记录存储数据时的顺序。

HashMap底层存储的数据结构为：数组＋链表。

二、源码分析

1）变量

    /**
     * HashMap的默认初始化容量：16，HashMap要求设置初始容量时最好是2的幂次方
     * 如果不是他会自动帮你转化成离初始值最近的一个2的幂次方
     */
    static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16

    /**
     * HashMap的最大容量
     */
    static final int MAXIMUM_CAPACITY = 1 << 30;

    /**
     * 默认加载因子，当map中的元素大于 table.length * 0.75 时则进行扩容
     */
    static final float DEFAULT_LOAD_FACTOR = 0.75f;

    /**
     * 默认树化阈值，当数组内的某个链表长度大于8，该链表就会转换为红黑树
     */
    static final int TREEIFY_THRESHOLD = 8;

    /**
     * 默认的退化阈值，当数组内的某棵红黑树中的节点个数小于6，该红黑树就会转换为链表
     */
    static final int UNTREEIFY_THRESHOLD = 6;

    /**
     * 默认的最小容量
     */
    static final int MIN_TREEIFY_CAPACITY = 64;

    /**
     * 存储链表的数组
     */
    transient Node<K,V>[] table;

    /**
     * 存储map中的key的集合
     */
    transient Set<Map.Entry<K,V>> entrySet;

    /**
     * 记录map中的元素个数
     */
    transient int size;

    /**
     * 记录操作次数
     */
    transient int modCount;

    /**
     * 扩容阈值
     */
    int threshold;

    /**
     * 加载因子
     */
    final float loadFactor;

2）内部类

    /**
     * 链表节点
     */
    static class Node<K,V> implements Map.Entry<K,V> {
        //key的hash值
        final int hash;
        final K key;
        V value;
        //记录下一节点，hashMap中的链表是单向链表只记录下一节点
        Node<K,V> next;

        Node(int hash, K key, V value, Node<K,V> next) {
            this.hash = hash;
            this.key = key;
            this.value = value;
            this.next = next;
        }

        public final K getKey()        { return key; }
        public final V getValue()      { return value; }
        public final String toString() { return key + "=" + value; }

        public final int hashCode() {
            return Objects.hashCode(key) ^ Objects.hashCode(value);
        }

        public final V setValue(V newValue) {
            V oldValue = value;
            value = newValue;
            return oldValue;
        }

        public final boolean equals(Object o) {
            if (o == this)
                return true;
            if (o instanceof Map.Entry) {
                Map.Entry<?,?> e = (Map.Entry<?,?>)o;
                if (Objects.equals(key, e.getKey()) &&
                    Objects.equals(value, e.getValue()))
                    return true;
            }
            return false;
        }
    }

    /**
     * 红黑树节点，详细的方法就不贴出来了
     * TreeNode是HashMap.Node<K,V>的子类，所以他也有next属性，方便数据迁移时使用。
     */
    static final class TreeNode<K,V> extends LinkedHashMap.Entry<K,V> {
        //树的根节点
        TreeNode<K,V> parent;  // red-black tree links
        TreeNode<K,V> left;
        TreeNode<K,V> right;
        //当前节点的父节点
        TreeNode<K,V> prev;    // needed to unlink next upon deletion
        boolean red;
        TreeNode(int hash, K key, V val, Node<K,V> next) {
            super(hash, key, val, next);
        }
        
        //获取当前节点所在树的根节点
        final TreeNode<K,V> root() {
            for (TreeNode<K,V> r = this, p;;) {
                if ((p = r.parent) == null)
                    return r;
                r = p;
            }
        }
        ...........
    }

3）构造方法，注意：HashMap只有在put的时候才会进行初始化

    /**
     * 无参构造方法
     */
    public HashMap() {
        this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
    }

    /**
     * 有参构造方法，给HashMap设置初始值，初始值最好是2的幂次方
     */ 
    public HashMap(int initialCapacity) {
        this(initialCapacity, DEFAULT_LOAD_FACTOR);
    }
    
    /**
     * 有参构造方法，给HashMap设置初始值并设置加载因子来确定扩容阈值
     */
    public HashMap(int initialCapacity, float loadFactor) {
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal initial capacity: " +
                                               initialCapacity);
        if (initialCapacity > MAXIMUM_CAPACITY)
            initialCapacity = MAXIMUM_CAPACITY;
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new IllegalArgumentException("Illegal load factor: " +
                                               loadFactor);
        this.loadFactor = loadFactor;
        // 将计算出来的值复制给threshold，后续初始化的时候会根据这个值初始化tab的大小
        this.threshold = tableSizeFor(initialCapacity);
    }

    /**
     * 将某个Map的子类对象转换为HashMap
     */
    public HashMap(Map<? extends K, ? extends V> m) {
        this.loadFactor = DEFAULT_LOAD_FACTOR;
        putMapEntries(m, false);
    }

4）tableSizeFor方法

HashMap中推荐初始化容量最好是2的幂次方但并没有强制要求，但是进行扩容等操作时又需要容量为2的幂次方，所以HashMap会自动将你设置的初始值转换为大于等于参数的第一个2的幂次方。

原理：2的幂次方以二进制的形式表示时，除了最高有效位其余位都为0。例如: 8->1000 16->10000。所以，我们只要将参数的最高有效位及其以后的位都变为1，然后再+1就可以把参数变为2的幂次方数。

    /**
     * 计算出大于等于参数的第一个2的幂次方
     */
    static final int tableSizeFor(int cap) {
        // cap - 1是为了防止cap本来就是2的幂次方
        int n = cap - 1;
        // 将n无符号右移1位再与n进行或运算
        n |= n >>> 1;
        n |= n >>> 2;
        n |= n >>> 4;
        n |= n >>> 8;
        n |= n >>> 16;
        return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
    }

初始值：位运算的目的是为了将所有的x变为1：

然后结果+1就会得到大于参数的第一个2的整数幂数：全过程示意图：

右移一位：

右移两位：

右移四位：

右移八位：

右移16位：

＋１变为２的整数幂：

总结：HashMap通过位运算将设置的初始值转为位２的整数幂的数。因为位运算是偏底层的运算所以是比较高效的。只通过五次位运算因为HashMap中规定了最大容量位 1 << 30,而五次位运算的位数是31，如果运算结果大于1 << 30 则将容量设置为默认的最大容量。

参考资料：https://www.cnblogs.com/xiyixiaodao/p/14483876.html

5）put方法

插入元素时可能发生hash碰撞，HashMap中是通过链式寻址法来解决hash碰撞的。

    /**
     * 往map中添加元素
     */
    public V put(K key, V value) {
        return putVal(hash(key), key, value, false, true);
    }
   
    /**
     * 这里的onlyIfAbsent表示如果出现hash冲突是否替换值，false为替换
     */
    final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        // HashMap的懒加载的只有再用到map的时候才会进行初始化
        // 只有第一次put的时候才会进行初始化操作
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
        
        // 这里先计算key的hash值，再判断tab中的该位置有无元素，没有则直接放入
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
        else {
            // 如果有计算出来的位置有对象则进行判断，即发生hash碰撞。
            Node<K,V> e; K k;
            // 该位置的第一个节点内容是否与待插入的对象一致，如果一样就进行替换
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
            // 如果不一样就判断该位置现在放的是链表还是红黑树
            // 如果是红黑树就调用红黑是的putTreeVal方法进行插入
            else if (p instanceof TreeNode)
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {
                // 如果是链表就遍历链表
                for (int binCount = 0; ; ++binCount) {
                    // 如果遍历到最后一个节点还没有插入则在尾部直接插入一个新节点
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        // 判断当前链表节点是否大于树化的阈值(8)
                        // 注意： 当binCount == 7 时链表中已经有9个节点了
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            // 树化
                            treeifyBin(tab, hash);
                        break;
                    }
                    // 逐一判断当前节点的内容与对象内容是否一致
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }

            // 此时如果e的值不为null说明上面的判断中记录了冲突节点，此时就需要对冲突节点的值进行                                    替换
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        // 记录操作次数
        ++modCount;
        // map当前容量+1，并判断+1后是否大于扩容阈值，如果大于则进行扩容
        if (++size > threshold)
            resize();
        afterNodeInsertion(evict);
        return null;
    }

6）hash值的计算与put对象插入位置的计算

    /**
     * 计算对象的hash值
     * 让对象hashCode方法计算出来的值的高16位与低16位进行异或运算
     */
    static final int hash(Object key) {
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }

tab[i = (n - 1) & hash]
(n - 1) & hash: 将对象的hash值与数组长度-1进行与运算则可以得到对象在数组中的位置。
为什么要数组长度-1？
    与运算：就是第一个操作数的第n位和第二个操作数的第n位都为1，结果数的第n位才为1否则为0
    假设数组长度为16
    如果不减一的话，那么16的二进制为：10000，任何hash值与它进行与运算只有两个结果10000或者00000这两个结果。
    减一的话，那么15的二进制为：1111，任何hash值与它进行与运算的结果都在0-15之间，这样保证了计算结果不会超过数组下标

7）resize方法

HashMap调用这个方法只有两个目的：

1、初始化数组

2、扩容

扩容时是逐一遍历数组，然后将数组内的链表或者红黑树的节点进行迁移

链表：链表中的节点迁移时需要逐一遍历链表节点，计算节点在新数组中的位置。迁移时计算位置并没有像插入数据时一样，将节点的hash值与新数组长度进行与运算。而是通过将链表中的节点分为高位链表和低位链表两条链表，低位链表是呆在新数组的原位，高位链表则是呆在新数组的原位下标+旧数组长度的位置。

如何区分节点属于高位链表还是低位链表呢？

将节点的hash值与旧数组长度进行与运算，如果为0则为低位链表，如果不为零则为高位链表。为什么只有两种结果，前面的hash值计算时我有说过。

为什么高位链表的位置是原位下标+旧数组长度？

假设扩容器数组长度为16，扩容后为32.

从图中可以看出，hash值于新数组长度-1进行与运算后，，结果与原下标的差距只在第五位，而第五位的结果只有0或1。即下标的变化只有在原下标或者原下标+16（旧数组长度）。

    /**
     * 进行初始化或扩容的方法
     */
    final Node<K,V>[] resize() {
        // 旧数组
        Node<K,V>[] oldTab = table;
        // 旧数组的大小
        int oldCap = (oldTab == null) ? 0 : oldTab.length;
        // 旧map的扩容阈值
        int oldThr = threshold;
        // 新map的大小，扩容阈值
        int newCap, newThr = 0;
        // 判断旧map的大小是否大于0
        // 大于0说明是要扩容
        if (oldCap > 0) {
            // 如果oldCap已经是最大容量了，则无法继续扩容
            if (oldCap >= MAXIMUM_CAPACITY) {
                threshold = Integer.MAX_VALUE;
                return oldTab;
            }
            // 这里将newCap扩大为原来的两倍
            else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                     oldCap >= DEFAULT_INITIAL_CAPACITY)
                // 因为容量给扩大了，所以加载因子也得随之扩大两倍
                newThr = oldThr << 1; // double threshold
        }
        // 如果oldCap小于0说明还未进行初始化
        // 这里是判断之前创建对象时是否有设置初始容量，如果有则按照设置的初始容量来
        else if (oldThr > 0) // initial capacity was placed in threshold
            newCap = oldThr;
        // 如果没设置初始容量，则将初始容量设置为默认容量(16),将加载因子设置为默认加载因子(0.75)
        else {               // zero initial threshold signifies using defaults
            newCap = DEFAULT_INITIAL_CAPACITY;
            newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
        }
        // 代码走到这newCap的值已经不可能为0了，这里就是对新扩容的计算
        if (newThr == 0) {
            float ft = (float)newCap * loadFactor;
            newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                      (int)ft : Integer.MAX_VALUE);
        }
        // 将计算出的新扩容阈值复制给threshold 
        threshold = newThr;
        @SuppressWarnings({"rawtypes","unchecked"})
        // 按照计算出的newCap创建新数组
        Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
        // 将新数组赋值给table
        table = newTab;

        // -------------代码走到这初始化的操作已经完成了-------------
        // oldTab如果为空说明调用此方法是为了初始化数组，就可以直接return table；了
        if (oldTab != null) {
            //下面是扩容操作的数据迁移
            for (int j = 0; j < oldCap; ++j) {
                Node<K,V> e;
                // 判断数组当前位置是否为空, 并将对象赋值给 e
                if ((e = oldTab[j]) != null) {
                    // 不为空则进行数据迁移，先将内存释放
                    oldTab[j] = null;
                    // 如果e的下一节点为空则说明此处只有一个元素，直接迁移即可
                    if (e.next == null)
                        newTab[e.hash & (newCap - 1)] = e;
                    // 如果当前节点属于红黑树对象，则调用红黑树的迁移方法
                    else if (e instanceof TreeNode)
                        ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                    // 如果是链表对象则将节点分为高低位两条链表， 再将两条链表迁移至新数组
                    else { // preserve order
                        // 地位链表
                        Node<K,V> loHead = null, loTail = null;
                        // 高位链表
                        Node<K,V> hiHead = null, hiTail = null;
                        Node<K,V> next;
                        do {
                            // 记录下一节点
                            next = e.next;
                            // 判断当前节点属于高位链表还是低位链表
                            if ((e.hash & oldCap) == 0) {
                                if (loTail == null)
                                    loHead = e;
                                else
                                    loTail.next = e;
                                loTail = e;
                            }
                            else {
                                if (hiTail == null)
                                    hiHead = e;
                                else
                                    hiTail.next = e;
                                hiTail = e;
                            }
                        } while ((e = next) != null);
                        // 将两条链表迁移至新数组
                        if (loTail != null) {
                            loTail.next = null;
                            // 低位链表放在新数组的原位
                            newTab[j] = loHead;
                        }
                        if (hiTail != null) {
                            hiTail.next = null;
                            // 高位链表放在新数组的(当前数组下标 + 旧数组长度)处
                            newTab[j + oldCap] = hiHead;
                        }
                    }
                }
            }
        }
        // 返回新数组
        return newTab;
    }

8）红黑树的数据迁移

红黑树的数据迁移和链表差不多，先将红黑树上的节点分为高位链表和低位链表。在判断高位链表和低位链表是否需要树化或者退化成链表。

    final void split(HashMap<K,V> map, Node<K,V>[] tab, int index, int bit) {
            TreeNode<K,V> b = this;
            // Relink into lo and hi lists, preserving order
            // 低位头节点和尾节点
            TreeNode<K,V> loHead = null, loTail = null;
            // 高位头节点和尾节点
            TreeNode<K,V> hiHead = null, hiTail = null;
            int lc = 0, hc = 0;
            // 遍历树
            for (TreeNode<K,V> e = b, next; e != null; e = next) {
                next = (TreeNode<K,V>)e.next;
                e.next = null;
                // bit就是就数组长度 hash值与旧数组长度进行与运算，判断下标是否改变
                if ((e.hash & bit) == 0) {
                    if ((e.prev = loTail) == null)
                        loHead = e;
                    else
                        loTail.next = e;
                    loTail = e;
                    ++lc;
                }
                else {
                    if ((e.prev = hiTail) == null)
                        hiHead = e;
                    else
                        hiTail.next = e;
                    hiTail = e;
                    ++hc;
                }
            }

            // 将链表放入对应位置并判断两条链表是否需要树化或者退化成链表
            if (loHead != null) {
                if (lc <= UNTREEIFY_THRESHOLD)
                    tab[index] = loHead.untreeify(map);
                else {
                    tab[index] = loHead;
                    if (hiHead != null) // (else is already treeified)
                        loHead.treeify(tab);
                }
            }
            if (hiHead != null) {
                if (hc <= UNTREEIFY_THRESHOLD)
                    tab[index + bit] = hiHead.untreeify(map);
                else {
                    tab[index + bit] = hiHead;
                    if (loHead != null)
                        hiHead.treeify(tab);
                }
            }
        }

9）树化：treeifyBin()，treeify(), untreeify()

m0_54063422

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
HashMap

HashMap是基于哈希表的Map 接口的实现。它还实现了Serialiable接口，因为存储数据的变量被transient修饰，所以它和ArrayList一样重写了writeObject方法和readObject方法。HashMap以键值对的方式来存储数据根据键的hashCode值存储数据，具有很快的访问速度，最多允许一条记录的键为 null，线程不安全的。HashMap是无序的，它不会记录存储数据时的顺序。数组＋链表。二、源码分析1）变量/**
复制链接

扫一扫