【源码解析】hashMap源码跟进

最新推荐文章于 2024-07-24 12:42:40 发布

老衲の少女心

最新推荐文章于 2024-07-24 12:42:40 发布

阅读量144

点赞数

分类专栏： #源码解析文章标签：链表数据结构 hashmap java

本文链接：https://blog.csdn.net/Wan_Yuan/article/details/105751857

版权

#源码解析专栏收录该内容

3 篇文章 0 订阅

订阅专栏

hashMap的实现原理

Java8以前底层数据结构：数组+链表。
Java8及以后底层数据结构：数组+链表+红黑树。默认情况下链表长度超过8变成红黑树（整个hashMap元素数量超过64），红黑树节点树小于6变回链表。

hashMap是如何解决hash冲突的问题的

如果发生了碰撞，新添加的元素将以链表的方式链接到后面。
如果链表长度超过阀值，就把链表转成红黑树。
如果链表长度低于6，就把红黑树转回链表。

hashMap的扩容

数组每个下标对应的位置称为hash槽，默认情况下，当拥有元素的hash槽数量超过当前容量乘以0.75，就会触发扩容操作，扩容为当前容量的2倍。

源码翻看

hashMap的属性

    public class HashMap<K,V> extends AbstractMap<K,V>
        implements Map<K,V>, Cloneable, Serializable {
        //序列号，序列化的时候使用。
        private static final long serialVersionUID = 362498820763181265L;
        /**
        * 默认容量，1向左移位4个，00000001变成00010000，也就是2的4次方为16
        * 使用移位是因为移位是计算机基础运算，效率比加减乘除快。
        **/
        static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;
        //最大容量，2的30次方。
        static final int MAXIMUM_CAPACITY = 1 << 30;
        //加载因子，用于扩容使用。这个参数的意义是：当数组长度达到当前长度 * 0.75时 需要扩容了！
        static final float DEFAULT_LOAD_FACTOR = 0.75f;
        //当某个桶节点数量大于8时，会转换为红黑树。
        static final int TREEIFY_THRESHOLD = 8;
        //当某个桶节点数量小于6时，会转换为链表，前提是它当前是红黑树结构。
        static final int UNTREEIFY_THRESHOLD = 6;
        //当整个hashMap中元素数量大于64时，也会进行转为红黑树结构。
        static final int MIN_TREEIFY_CAPACITY = 64;
        //存储元素的数组，transient关键字表示该属性不能被序列化
        transient Node<K,V>[] table;
        //将数据转换成set的另一种存储形式，这个变量主要用于迭代功能。
        transient Set<Map.Entry<K,V>> entrySet;
        //元素数量
        transient int size;
        //统计该map修改的次数
        transient int modCount;
        //临界值，也就是元素数量达到临界值时，会进行扩容。
        int threshold;
        //也是加载因子，只不过这个是变量。
        final float loadFactor;

构造方法

构造方法中，都是依靠第三个方法来执行的，但是前三个方法都没有进行数组的初始化操作，即使调用了构造方法此时存放HaspMap中数组元素的table表长度依旧为0 。在第四个构造方法中调用了inflateTable()方法完成了table的初始化操作，并将m中的元素添加到HashMap中。

    /** 
    * 构造方法 1    无参构造方法，使用默认初始容量16与默认负载因子0.75构造一个空的HashMap。
    */
    public HashMap() {
        // 初始化加载因子
        this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
    }
    
    /** 
    * 构造方法 2    传入初始容量，通过默认负载因子构造一个空的HashMap
    * 调用了HashMap(int initialCapacity, float loadFactor)构造方法。
    */
    public HashMap(int initialCapacity) {
        // 调用构造方法3，并传入加载因子
        this(initialCapacity, DEFAULT_LOAD_FACTOR);
    }
    
    /** 
    * 构造方法 3     传入初始容量和负载因子来构造一个空的HashMap。
    */
    public HashMap(int initialCapacity, float loadFactor) {
        // 初始容量不能小于0
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal initial capacity: " + initialCapacity);
        // 初始容量不能大于MAXIMUM_CAPACITY（最大容量）
        if (initialCapacity > MAXIMUM_CAPACITY)
            initialCapacity = MAXIMUM_CAPACITY;
        // 校验负载因子合法性
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new IllegalArgumentException("Illegal load factor: " + loadFactor);
        this.loadFactor = loadFactor;
        // 计算下次resize的阈值
        this.threshold = tableSizeFor(initialCapacity);
    }
    
    /** 
    * 构造方法 4     指定集合，转化为HashMap，使用默认初始容量与默认负载因子。
    */
    public HashMap(Map<? extends K, ? extends V> m) {
        // 初始化加载因子
        this.loadFactor = DEFAULT_LOAD_FACTOR;
        // 将m中的所有元素添加至hashMap中
        putMapEntries(m, false);
    }
    
    
        final void putMapEntries(Map<? extends K, ? extends V> m, boolean evict) {
            //获取该map的实际长度
            int s = m.size();
            if (s > 0) {
                //判断table是否初始化，如果没有初始化
                if (table == null) { // pre-size
                    /**
                    * 求出需要的容量，因为实际使用的长度=容量*0.75得来的，
                    * +1是因为小数相除，基本都不会是整数，容量大小不能为小数的，
                    * 后面转换为int，多余的小数就要被丢掉，所以+1，
                    * 例如，map实际长度22，22/0.75=29.3,所需要的容量肯定为30，
                    * 如果刚刚好除得整数呢，除得整数的话，容量大小多1也没什么影响
                    **/
                    float ft = ((float)s / loadFactor) + 1.0F;
                    //判断该容量大小是否超出上限。
                    int t = ((ft < (float)MAXIMUM_CAPACITY) ? (int)ft : MAXIMUM_CAPACITY);
                    /**
                    * 对临界值进行初始化，tableSizeFor(t)这个方法会返回大于t值的，且离其最近的2次幂，
                    * 例如t为29，则返回的值是32
                    **/
                    if (t > threshold)
                        threshold = tableSizeFor(t);
                }
                //如果table已经初始化，则进行扩容操作，resize()就是扩容。
                else if (s > threshold)
                    resize();
                //遍历，把map中的数据转到hashMap中。
                for (Map.Entry<? extends K, ? extends V> e : m.entrySet()) {
                    K key = e.getKey();
                    V value = e.getValue();
                    putVal(hash(key), key, value, false, evict);
                }
            }
        }

扩容方法

    	final Node<K,V>[] resize() {
            // 把之前的数组变成 oldTab
            Node<K,V>[] oldTab = table;
            //old 的长度
            int oldCap = (oldTab == null) ? 0 : oldTab.length;
            //old 的临界值
            int oldThr = threshold;
            //初始化new的长度和临界值
            int newCap, newThr = 0;
            //oldCap > 0也就是说不是首次初始化，因为hashMap用的是懒加载
            if (oldCap > 0) {
                // 大于最大值
                if (oldCap >= MAXIMUM_CAPACITY) {
                    //临界值为整数的最大值
                    threshold = Integer.MAX_VALUE;
                    return oldTab; // 不需要扩容，直接返回 old
                }
                // 没有超过最大值，扩容两倍，并且扩容后的长度要小于最大值，old 长度也要大于16
                else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                         oldCap >= DEFAULT_INITIAL_CAPACITY)
                    // 临界值扩容为 old 的临界值2倍
                    newThr = oldThr << 1; 
            }
            /**
            * 如果oldCap<0，但是已经初始化了，像把元素删除完之后的情况，那么它的临界值肯定还存在，
            * 如果是首次初始化，它的临界值则为0
            **/
            else if (oldThr > 0)  // old 的临界值 大于0
                newCap = oldThr;
            // 首次初始化，给与默认的值
            else {               
                newCap = DEFAULT_INITIAL_CAPACITY;
                // 临界值 等于 容量 * 加载因子
                newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
            }
            
            // 初始化时容量小于默认值16的，此时newThr没有赋值，计算新的resize上限
            if (newThr == 0) {
                // new的临界值
                float ft = (float)newCap * loadFactor;
                // 判断是否new容量是否大于最大值，临界值是否大于最大值
                newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                          (int)ft : Integer.MAX_VALUE);
            }
            // 把上面各种情况分析出的临界值，在此处真正进行改变，也就是容量和临界值都改变了。
            threshold = newThr;
            // 表示忽略该警告
            @SuppressWarnings({"rawtypes","unchecked"})
            // 初始化
            Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
            // 赋予当前的table
            table = newTab;
            // 此处是把old中的元素，遍历到new中
            if (oldTab != null) {
                for (int j = 0; j < oldCap; ++j) {
                    // 临时变量
                    Node<K,V> e;
                    // 当前哈希桶的位置值不为null，也就是数组下标处有值，因为有值表示可能会发生冲突
                    if ((e = oldTab[j]) != null) {
                        // 把已经赋值之后的变量置位null，为了好回收，释放内存
                        oldTab[j] = null;
                        // 如果下标处的节点没有下一个元素
                        if (e.next == null)
                            // 把该变量的值存入newCap中，e.hash & (newCap - 1)并不等于j
                            newTab[e.hash & (newCap - 1)] = e;
                        // 该节点为红黑树结构，也就是存在哈希冲突，该哈希桶中有多个元素
                        else if (e instanceof TreeNode)
                            //把此树进行转移到newCap中
                            ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                        else { 
                            /**
                            * 此处表示为链表结构，同样把链表转移到newCap中，
                            * 就是把链表遍历后，把值转过去，在置位null
                            **/
                            Node<K,V> loHead = null, loTail = null;
                            Node<K,V> hiHead = null, hiTail = null;
                            Node<K,V> next;
                            do {
                                next = e.next;
                                // 原索引
                                if ((e.hash & oldCap) == 0) {
                                    if (loTail == null)
                                        loHead = e;
                                    else
                                        loTail.next = e;
                                    loTail = e;
                                }
                                // 原索引+oldCap
                                else {
                                    if (hiTail == null)
                                        hiHead = e;
                                    else
                                        hiTail.next = e;
                                    hiTail = e;
                                }
                            } while ((e = next) != null);
                            if (loTail != null) {
                                loTail.next = null;
                                newTab[j] = loHead;
                            }
                            if (hiTail != null) {
                                hiTail.next = null;
                                newTab[j + oldCap] = hiHead;
                            }
                        }
                    }
                }
            }
            //返回扩容后的hashMap
            return newTab;
        }

添加方法

    	public V put(K key, V value) {
            /**
            * 四个参数，
            * 第一个hash值，
            * 第四个参数表示如果该key存在值，如果为null的话，则插入新的value，
            * 最后一个参数，在hashMap中没有用，可以不用管，使用默认的即可
            **/
            return putVal(hash(key), key, value, false, true);
        }
     
        final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                       boolean evict) {
            // tab 哈希数组，p 该哈希桶的首节点，n hashMap的长度，i 计算出的数组下标
            Node<K,V>[] tab; Node<K,V> p; int n, i;
            // 获取长度并进行扩容，使用的是懒加载，table一开始是没有加载的，等put后才开始加载
            if ((tab = table) == null || (n = tab.length) == 0)
                n = (tab = resize()).length;
            /**
            * 如果计算出的该哈希桶的位置没有值，则把新插入的key-value放到此处，
            * 此处就算没有插入成功，也就是发生哈希冲突时也会把哈希桶的首节点赋予p
            **/
            if ((p = tab[i = (n - 1) & hash]) == null)
                tab[i] = newNode(hash, key, value, null);
            //发生哈希冲突的几种情况
            else {
                // e 临时节点的作用， k 存放该当前节点的key 
                Node<K,V> e; K k;
                // 第一种，插入的key-value的hash值，key都与当前节点的相等，e = p，则表示为首节点
                if (p.hash == hash &&
                    ((k = p.key) == key || (key != null && key.equals(k))))
                    e = p;
                // 第二种，hash值不等于首节点，判断该p是否属于红黑树的节点
                else if (p instanceof TreeNode)
                    /**
                    * 为红黑树的节点，则在红黑树中进行添加，
                    * 如果该节点已经存在，则返回该节点（不为null），
                    * 该值很重要，用来判断put操作是否成功，如果添加成功返回null
                    **/
                    e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
                // 第三种，hash值不等于首节点，不为红黑树的节点，则为链表的节点
                else {
                    // 遍历该链表
                    for (int binCount = 0; ; ++binCount) {
                        // 如果找到尾部，则表明添加的key-value没有重复，在尾部进行添加
                        if ((e = p.next) == null) {
                            p.next = newNode(hash, key, value, null);
                            // 判断是否要转换为红黑树结构
                            if (binCount >= TREEIFY_THRESHOLD - 1) 
                                treeifyBin(tab, hash);
                            break;
                        }
                        // 如果链表中有重复的key，e则为当前重复的节点，结束循环
                        if (e.hash == hash &&
                            ((k = e.key) == key || (key != null && key.equals(k))))
                            break;
                        p = e;
                    }
                }
                // 在循环中判断e是否为null，如果为null则表示加了一个新节点，
                // 不是null则表示找到了hash、key都一致的Node。
                if (e != null) { 
                    V oldValue = e.value;
                    // 判断是否更新value值
                    // map提供putIfAbsent方法，如果key存在，不更新value
                    // 但是如果value==null任何情况下都更改此值
                    if (!onlyIfAbsent || oldValue == null)
                        e.value = value;
                    // 此方法是空方法，什么都没实现，用户可以根据需要进行覆盖
                    afterNodeAccess(e);
                    return oldValue;
                }
            }
            // 到了此步骤，则表明待插入的key-value是没有key的重复，因为插入成功e节点的值为null
            // 修改次数+1
            ++modCount;
            // 实际长度+1，判断是否大于临界值，大于则扩容
            if (++size > threshold)
                resize();
            // 此方法是空方法，什么都没实现，用户可以根据需要进行覆盖
            afterNodeInsertion(evict);
            // 添加成功
            return null;
        }

删除方法

    	public V remove(Object key) {
            //临时变量
            Node<K,V> e;
            /**
            * 调用removeNode(hash(key), key, null, false, true)进行删除，
            * 第三个value为null，表示，把key的节点直接都删除了，不需要用到值，
            * 如果设为值，则还需要去进行查找操作
            **/
            return (e = removeNode(hash(key), key, null, false, true)) == null ?
                null : e.value;
        }
        
        /**
        * 第一参数为哈希值，
        * 第二个为key，
        * 第三个value，
        * 第四个为是为true的话，则表示删除它key对应的value，不删除key,
        * 第四个如果为false，则表示删除后，不移动节点
        **/
        final Node<K,V> removeNode(int hash, Object key, Object value,
                                   boolean matchValue, boolean movable) {
            // tab 哈希数组，p 数组下标的节点，n 长度，index 当前数组下标
            Node<K,V>[] tab; Node<K,V> p; int n, index;
            // 哈希数组不为null，且长度大于0，然后获得到要删除key的节点所在是数组下标位置
            if ((tab = table) != null && (n = tab.length) > 0 &&
                (p = tab[index = (n - 1) & hash]) != null) {
                // nodee 存储要删除的节点，e 临时变量，k 当前节点的key，v 当前节点的value
                Node<K,V> node = null, e; K k; V v;
                // 如果数组下标的节点正好是要删除的节点，把值赋给临时变量node
                if (p.hash == hash &&
                    ((k = p.key) == key || (key != null && key.equals(k))))
                    node = p;
                // 也就是要删除的节点，在链表或者红黑树上，先判断是否为红黑树的节点
                else if ((e = p.next) != null) {
                    if (p instanceof TreeNode)
                        // 遍历红黑树，找到该节点并返回
                        node = ((TreeNode<K,V>)p).getTreeNode(hash, key);
                    else { // 表示为链表节点，一样的遍历找到该节点
                        do {
                            if (e.hash == hash &&
                                ((k = e.key) == key ||
                                 (key != null && key.equals(k)))) {
                                node = e;
                                break;
                            }
                            /**
                            * 注意，如果进入了链表中的遍历，那么此处的p不再是数组下标的节点，
                            * 而是要删除结点的上一个结点
                            **/
                            p = e;
                        } while ((e = e.next) != null);
                    }
                }
                // 找到要删除的节点后，判断!matchValue，我们正常的remove删除，!matchValue都为true
                if (node != null && (!matchValue || (v = node.value) == value ||
                                     (value != null && value.equals(v)))) {
                    // 如果删除的节点是红黑树结构，则去红黑树中删除
                    if (node instanceof TreeNode)
                        ((TreeNode<K,V>)node).removeTreeNode(this, tab, movable);
                    // 如果是链表结构，且删除的节点为数组下标节点，也就是头结点，直接让下一个作为头
                    else if (node == p)
                        tab[index] = node.next;
                    else 
                        /**
                    	* 为链表结构，删除的节点在链表中，把要删除的下一个结点设为上一个结点的下一个节点
                    	**/
                        p.next = node.next;
                    // 修改计数器
                    ++modCount;
                    // 长度减一
                    --size;
                    /**
                    * 此方法在hashMap中是为了让子类去实现，主要是对删除结点后的链表关系进行处理
                    **/
                    afterNodeRemoval(node);
                    // 返回删除的节点
                    return node;
                }
            }
            // 返回null则表示没有该节点，删除失败
            return null;
        }

获取方法

    public V get(Object key) {
        Node<K,V> e;
        //也是调用getNode方法来完成的
        return (e = getNode(hash(key), key)) == null ? null : e.value;
    }

    final Node<K,V> getNode(int hash, Object key) {
        // first 头结点，e 临时变量，n 长度,k key
        Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
        // table不为空 && table长度大于0 && table索引位置(根据hash值计算出)节点不为空
        if ((tab = table) != null && (n = tab.length) > 0 &&
            (first = tab[(n - 1) & hash]) != null) {
            // first的key等于传入的key则返回first对象
            if (first.hash == hash && // always check first node
                ((k = first.key) == key || (key != null && key.equals(k))))
                return first;
            //first的key不等于传入的key则说明是链表，向下遍历
            if ((e = first.next) != null) {
                // 判断是否为TreeNode，是则为红黑树
                // 如果是红黑树节点，则调用红黑树的查找目标节点方法getTreeNode
                if (first instanceof TreeNode)
                    return ((TreeNode<K,V>)first).getTreeNode(hash, key);
                do {
                    //走下列步骤表示是链表，循环至节点的key与传入的key值相等
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        return e;
                } while ((e = e.next) != null);
            }
        }
        //找不到符合的返回空
        return null;
    }

计算哈希

    	static final int hash(Object key) {
            int h;
            // 如果key == null 则将数据存入下标0的位置
            return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
        }

总结：

所以key值可以为null，存入下标0的位置
默认创建的hashmap默认长度为16
HashMap使用的是懒加载，构造完HashMap对象后，只要不进行put 方法插入元素，HashMap并不会去初始化或者扩容table。当首次调用put方法时，HashMap会发现table为空然后调用resize方法进行初始化

老衲の少女心

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【源码解析】hashMap源码跟进

hashMap的实现原理Java8以前底层数据结构：数组+链表。Java8及以后底层数据结构：数组+链表+红黑树。默认情况下链表长度超过8变成红黑树（整个hashMap元素数量超过64），红黑树节点树小于6变回链表。hashMap是如何解决hash冲突的问题的如果发生了碰撞，新添加的元素将以链表的方式链接到后面。如果链表长度超过阀值，就把链表转成红黑树。如果链表...
复制链接

扫一扫

专栏目录