十分详细的HashMap 源码

Code-zyc

已于 2024-03-11 10:33:06 修改

阅读量2.3k

点赞数 5

分类专栏：源码啊！文章标签： java

于 2022-04-23 19:57:52 首次发布

本文链接：https://blog.csdn.net/weixin_45960212/article/details/124359064

版权

源码啊！专栏收录该内容

13 篇文章 0 订阅

订阅专栏

前置知识

1：HashMap在1.7 是 Entry数组+链表 1.8是 Node数组+链表+红黑树

重要变量的解释

首先是该方法的变量如下图
在这里插入图片描述

DEFAULT_INITIAL_CAPACITY

表示的意思就是 默认初始化的容量16
注意容量必须是 2的幂次方倍数，至于源码如何实现的，是利用后面的位运算进行实现的，后面会讲。


    /**
     * The default initial capacity - MUST be a power of two.
     */
    static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16

MAXIMUM_CAPACITY

表示这个容器的长度最多不超过1,073,741,824


    /**
     * The maximum capacity, used if a higher value is implicitly specified
     * by either of the constructors with arguments.
     * MUST be a power of two <= 1<<30.
     */
    static final int MAXIMUM_CAPACITY = 1 << 30;

DEFAULT_LOAD_FACTOR

就是所谓的负载负载因子，当达到这个要求：负载因子*当前容量<当前


    /**
     * The load factor used when none specified in constructor.
     */
    static final float DEFAULT_LOAD_FACTOR = 0.75f;

TREEIFY_THRESHOLD

则是从链表变为树的一个阈值，当新插入的节点加起来>8 才有可能进行树化，其是从后面的源码可以知道进行树化的具体条件：
该列表已经有8个节点了才能变成红黑树（加上这个新节点9个）先插入并且所有元素的个数大于等于64个元素才能树化
如果达到了 9个但是没到 64个就扩容让链表变短
这个64则是下面要介绍 MIN_TREEIFY_CAPACITY
源码：
在这里插入图片描述


    /**
     * The bin count threshold for using a tree rather than list for a
     * bin.  Bins are converted to trees when adding an element to a
     * bin with at least this many nodes. The value must be greater
     * than 2 and should be at least 8 to mesh with assumptions in
     * tree removal about conversion back to plain bins upon
     * shrinkage.
     */
    static final int TREEIFY_THRESHOLD = 8;

UNTREEIFY_THRESHOLD

这个变量表示的是从树化变成链化的条件。当树化的元素小于6则进行链化。


    /**
     * The bin count threshold for untreeifying a (split) bin during a
     * resize operation. Should be less than TREEIFY_THRESHOLD, and at
     * most 6 to mesh with shrinkage detection under removal.
     */
    static final int UNTREEIFY_THRESHOLD = 6;

MIN_TREEIFY_CAPACITY

就是进行树化的那个表容量的判断详细解释 TREEIFY_THRESHOLD
注意这个参数的值至少是 4*TREEIFY_THRESHOLD


    /**
     * The smallest table capacity for which bins may be treeified.
     * (Otherwise the table is resized if too many nodes in a bin.)
     * Should be at least 4 * TREEIFY_THRESHOLD to avoid conflicts
     * between resizing and treeification thresholds.
     */
    static final int MIN_TREEIFY_CAPACITY = 64;

方法开始执行：

看方法的启动：
在这里插入图片描述

无参构造创建：

很明显这次的初始化我们只设置了负载因子，并没有进行数组的初始化
在这里插入图片描述

有参构建

直接看两个参数的那个有参构造因为一个的也是调用的两个：
在这里插入图片描述
他只是帮你把负载因子给你用默认的传进去
有参构建：

public HashMap(int initialCapacity, float loadFactor) {
        //判断 你初始化的大小 小于0 直接报错
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal initial capacity: " +
                    initialCapacity);
        //初始化 过大  就用默认得最大值
        if (initialCapacity > MAXIMUM_CAPACITY)
            initialCapacity = MAXIMUM_CAPACITY;
        //负载因子是否规范
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new IllegalArgumentException("Illegal load factor: " +
                    loadFactor);
        //都完成了 则进行赋值
        this.loadFactor = loadFactor;
        //这个方法则是 是得 容量是2的幂次方的关键
        this.threshold = tableSizeFor(initialCapacity);
    }

tableSizeFor方法：
在这里插入图片描述
进行测试的代码：

结果+1 则是他们最近的 2的次方数
注意默认大小是16

put方法

在这里插入图片描述

putValue方法

第四个参数如果为 true 则表示存放进行相同的key值但是value值不会进行改变了默认为flase
第五个为false 表示这个表正在创建中。

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; //对应创建的数组
        Node<K,V> p;//用来记录当前浏览的元素坐标
        int n, i;//n记录表的长度
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;//进来则表示 数组为空 需要创建
        if ((p = tab[i = (n - 1) & hash]) == null)//进行hahs计算 算坐标 这个位置 有没有 元素 没有直接放进去就行
            tab[i] = newNode(hash, key, value, null);
        else {//表示这个位置 有元素  则需要进行匹配
            Node<K,V> e;//临时元素 记录是否存在相同key的
            K k;//记录记录k的
            if (p.hash == hash &&
                    ((k = p.key) == key || (key != null && key.equals(k))))
                //表示 key的hash值相等 && key的内容也相等 则把p赋值给e
                //第一个元素就是 要替换的元素
                e = p;
            else if (p instanceof TreeNode)//这个节点是树 用红黑树的方法进行插入
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {//开始从这个列表找节点
                for (int binCount = 0; ; ++binCount) {
                    if ((e = p.next) == null) {//注意这一步就已经开始移动了  开始从第二个元素开始了  记住代表 0-》2
                        //表示到末尾了 直接把这个值插进去就行
                        p.next = newNode(hash, key, value, null);
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            //已存在8哥了 你是第9个  那 咱就开始树化吧
                            //为什么是8  不是》=8-1吗   注意前面说的 0代表第2个元素的坐标了  所以 满足条件的7 代表第9个元素
                            //里面还有一个逻辑判断  要64个元素才能开始 树化 否则就只能去扩容了
                            treeifyBin(tab, hash);
                        break;
                    }
                    if (e.hash == hash &&
                            ((k = e.key) == key || (key != null && key.equals(k))))
                        //表示找到了 一样得 退出
                        break;
                    p = e;
                }
            }
            if (e != null) { // existing mapping for key
                //表示存在相同的key
                V oldValue = e.value;
                //查看是否要进行 值的替换
                if (!onlyIfAbsent || oldValue == null)
                    //替换
                    e.value = value;
                //空方法 留给LinkedHashMap操作的
                afterNodeAccess(e);
                return oldValue;
            }
        }
        //这个参数是记录修改次数的
        //快速失败 （fail-fast）有用
        ++modCount;
        //计算 目前的元素含量 是否大于了 threshold（负载因子*容量）
        if (++size > threshold)
            //大于开始扩容
            resize();
        //空方法 留给LinkedHashMap操作的
        afterNodeInsertion(evict);
        return null;
    }

resize 初始化或加倍表大小

在这里插入图片描述

具体的解释已经写在代码中自己写的又不完善的地方欢迎提出

final Node<K,V>[] resize() {
        Node<K,V>[] oldTab = table;
        int oldCap = (oldTab == null) ? 0 : oldTab.length;
        int oldThr = threshold;//这个参数属于是 负载因子*容量
        int newCap, newThr = 0;
        if (oldCap > 0) {//这个表示 数组创建了 是进来扩容的
            if (oldCap >= MAXIMUM_CAPACITY) {//如果容量已经达到最大值了
                //负载因子调到最大 以后别进来了 扩容不了了
                threshold = Integer.MAX_VALUE;
                return oldTab;//直接返回原来的不进行扩容的操作
            }//没有达到最大值 进行扩容的操作
            //这一步操作 则是 将老的扩大一倍 没有超过最大容量
            //并且老的容量比默认的16要大 则将threshold（负载因子*容量）扩大一倍
            else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                    oldCap >= DEFAULT_INITIAL_CAPACITY)
                newThr = oldThr << 1; // double threshold
        }//这个表示 前面的没进去（那就是 不是来扩容的  是来初始化的） 且threshold有值
        //就是你在new的时候 传得有 参数就会进入这个  方法 并且oldThr的值 肯定是2的次方倍 为什么请看构造方法
        //则通过 threshold给你的这个容量赋值
        else if (oldThr > 0) // initial capacity was placed in threshold
            newCap = oldThr;
        else {              // zero initial threshold signifies using defaults
            //进入到这个表示 完全是 new的时候 什么参数也没传 那就全部都有源码的默认值
            newCap = DEFAULT_INITIAL_CAPACITY;
            newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
        }
        if (newThr == 0) {
            //这个主要是针对上面的else if (oldThr > 0) 因为走那个方法的话 newThr肯定为0
            //开始计算负载因子*容量
            float ft = (float)newCap * loadFactor;
            //给threshold赋值 如果容量超过了默认的最大容量 则给个最大值 没有则将刚刚计算的值赋予即可
            newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                    (int)ft : Integer.MAX_VALUE);
        }
        //完成threshold的赋值
        threshold = newThr;
        //下面这一步就是 初始化计算好的数组
        @SuppressWarnings({"rawtypes","unchecked"})
        Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
        //将数组赋值回去
        table = newTab;
        //下面这一步则是进行 元素的转移
        //你扩容了 是不是 需要把数组里面的元素进行 hash计算然后赋值回去嘛
        if (oldTab != null) {
            //遍历一遍这个数组里面的所有元素
            for (int j = 0; j < oldCap; ++j) {
                //注意node 这个类 里面是 有next这个属性的
                Node<K,V> e;
                if ((e = oldTab[j]) != null) {
                    //把位置清空
                    oldTab[j] = null;
                    //判断该节点下面有没有元素
                    if (e.next == null)
                        //下一个元素没有值  算hash值把他放到行数组里面去
                        newTab[e.hash & (newCap - 1)] = e;
                    else if (e instanceof TreeNode)//表示 这个链表已经树化
                        ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                    else { // preserve order表示 没有树化还是个 列表
                        Node<K,V> loHead = null, loTail = null;
                        Node<K,V> hiHead = null, hiTail = null;
                        Node<K,V> next;//记录下一个元素的
                        do {
                            next = e.next;
                            //注意 这里是 oldcap  不是 oldcap-1
                            //下面这一些列的操作 起到的作用就是 将 该部分的链的元素 分成两个部分
                            //一部分叫 low  low这一部分 的坐标可以直接插进到雨原来的部位去 一部分叫 hei插入到新的计算后的坐标去
                            //例子： a：hash 14  b:hahs 30  在16的容量下 两个元素的位置都是在14的坐标下
                            //进行扩容后 a 应该还是 14  b 则应该时 30 
                            if ((e.hash & oldCap) == 0) {
                                //就是 将这些串起来
                                if (loTail == null)
                                    loHead = e;
                                else
                                    loTail.next = e;
                                loTail = e;
                            }
                            else {//不为0 那就用另一个 串起来
                                if (hiTail == null)
                                    hiHead = e;
                                else
                                    hiTail.next = e;
                                hiTail = e;
                            }
                        } while ((e = next) != null);
                        //经过这个循环  得到 两串链表 low（保持坐标不表） hig  （更新坐标）
                        //下面这一步  则是 将两串放到该放的位置
                        if (loTail != null) {
                            loTail.next = null;
                            newTab[j] = loHead;
                        }
                        if (hiTail != null) {
                            hiTail.next = null;
                            newTab[j + oldCap] = hiHead;
                        }
                    }
                }
            }
        }
        return newTab;
    }

split （扩容时将树进行拆分）

注意 treenode 继承自node 它不仅时树也是列表的结构
在这里插入图片描述

final void split(HashMap<K,V> map, Node<K,V>[] tab, int index, int bit) {
            //tab是newtable  不是oldtable
            //index 时 咱要拆分的那个树所在 坐标
            //bit  是 oldcap容量
            TreeNode<K,V> b = this;
            // Relink into lo and hi lists, preserving order
            TreeNode<K,V> loHead = null, loTail = null;
            TreeNode<K,V> hiHead = null, hiTail = null;
            int lc = 0, hc = 0;  //这是用来记录两颗树的  长度的 要是 太小了 就要进行变换  将其变成链表
            for (TreeNode<K,V> e = b, next; e != null; e = next) {
                next = (TreeNode<K,V>)e.next;
                e.next = null;
                //这一步 也是和 前面的列表操作类似 也是 将 里面的树 进行区分位low 和hig
                if ((e.hash & bit) == 0) {
                    if ((e.prev = loTail) == null)
                        loHead = e;
                    else
                        loTail.next = e;
                    loTail = e;
                    ++lc;
                }
                else {
                    if ((e.prev = hiTail) == null)
                        hiHead = e;
                    else
                        hiTail.next = e;
                    hiTail = e;
                    ++hc;
                }
            }
            //执行完这操作 就分成了两颗树 说是树但是 low和hig 其实只是在用  pre 和nex 更像是 列表
            //然后 看看low这棵树 元素熟路是否小于等于UNTREEIFY_THRESHOLD（默认6）
            if (loHead != null) {
                if (lc <= UNTREEIFY_THRESHOLD)
                    //如果数量太少则进行链化
                    tab[index] = loHead.untreeify(map);
                else {
                    //没有则满足要求 进行位置的移动即可
                    tab[index] = loHead;
                    if (hiHead != null) // (else is already treeified)
                        //将这个low树进行重新树化   
                        // 为什么是树了还要树化？  上面说了 他们只用到了prev和next 完全不是树 所以需要进行树化 之所以叫他们说 是因为他们是treenode类
                        //至于为什么 需要判断hiHead != null 才能进行操作 是为了提高效率
                        //比如你想一下你搞半天  hig那个树 啥也没有 不就是证明 都在low上面 那还需要重新树化什么 直接搞过去就行
                        loHead.treeify(tab);
                }
            }
            //与上面的原理一致
            if (hiHead != null) {
                if (hc <= UNTREEIFY_THRESHOLD)
                    tab[index + bit] = hiHead.untreeify(map);
                else {
                    tab[index + bit] = hiHead;
                    if (loHead != null)
                        hiHead.treeify(tab);
                }
            }
        }

untreeify（将节点变成链表）

   final Node<K,V> untreeify(HashMap<K,V> map) {
            Node<K,V> hd = null, tl = null;
            //从当前传过来的节点开始遍历
            for (Node<K,V> q = this; q != null; q = q.next) {
                Node<K,V> p = map.replacementNode(q, null);
                if (tl == null)
                    hd = p;
                else
                    tl.next = p;
                tl = p;
            }
            return hd;
        }

treeify（将节点变成树）

 final void treeify(Node<K,V>[] tab) {
            TreeNode<K,V> root = null;
            //利用当前穿过来的这个 this 进行遍历  前面说了 low 和hig 只用到了 prev 和next 更像是列表
            //所以这个方法是让他们彻底变成真正得树
            for (TreeNode<K,V> x = this, next; x != null; x = next) {
                //转换成TreeNode对象
                next = (TreeNode<K,V>)x.next;
                x.left = x.right = null;
                //root为空，证明是第一个对象
                if (root == null) {
                    //设置根节点
                    x.parent = null;
                    x.red = false;
                    root = x;
                }
                //root不为空，根节点已经存在了，处理剩下对象
                else {
                    K k = x.key;
                    int h = x.hash;
                    Class<?> kc = null;
                    //对x之后的对象，进行划分左右
                    for (TreeNode<K,V> p = root;;) {
                        int dir, ph;
                        K pk = p.key;
                        //判断当前对象是应该划分到左边还是右边 -1放在左边  1放在右边
                        if ((ph = p.hash) > h)
                            dir = -1;
                        else if (ph < h)
                            dir = 1;
                        else if ((kc == null &&
                                (kc = comparableClassFor(k)) == null) ||
                                (dir = compareComparables(kc, k, pk)) == 0)
                            dir = tieBreakOrder(k, pk);

                        TreeNode<K,V> xp = p;
                        if ((p = (dir <= 0) ? p.left : p.right) == null) {
                            x.parent = xp;
                            //对象进行划分左右
                            if (dir <= 0)
                                xp.left = x;
                            else
                                xp.right = x;
                            //处理当前节点（判断是红色节点，还是黑色节点，是否需要右旋转，左旋转）
                            root = balanceInsertion(root, x);
                            break;
                        }
                    }
                }
            }
            //再次确定根节点
            moveRootToFront(tab, root);
        }

treeifyBin(列表进行树化)

final void treeifyBin(Node<K,V>[] tab, int hash) {
        int n, index; Node<K,V> e;
        //判断 数组是空的 或者  数量小于64  那就去扩容吧 别来树化了
        if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
            resize();
            //以防万一 在确定一下 你传的这个位置上是不是空的  顺便给e赋值
        else if ((e = tab[index = (n - 1) & hash]) != null) {
            //
            TreeNode<K,V> hd = null, tl = null;
            do {
                //就是创建一个 treenode  你可以理解为 把e从node 变成了treenode
                TreeNode<K,V> p = replacementTreeNode(e, null);
                //下面这一步 就是熟悉的 将单链表 变成双向链表
                //然后交给treeify进行树化了
                if (tl == null)
                    hd = p;
                else {
                    p.prev = tl;
                    tl.next = p;
                }
                tl = p;
            } while ((e = e.next) != null);
            //执行完上面的循环  则这个列表是双向的列表
            //下面这个判断 在进行 判断 那个位置 是否为空
            if ((tab[index] = hd) != null)
                //进行树化
                hd.treeify(tab);
        }
    }

面试可能会问的问题：

扩容的条件

1.8 hashmap的扩容机制很简单：就是当前的size（目前存放的元素）>threshold(负载因子（默认是0.75）*容量)
1.7 hahsmap的扩容机制额外有个条件：当前插入的格子不为空
下图是源码证明
在这里插入图片描述

扩容对元素坐标的处理

**1.8:**不论是树还是列表都采用了low和 hig 进行存放
low表示就算扩容了坐标的位置依旧不变，
hig表示坐标的位置需要改变（+oldcap即可）
1.7老实巴交的计算hash的坐标然后放进去

key=null

key为null 是存放在0这个坐标的。

什么时候初始化

看了源码都知道是在调用put的时候才会进行初始化

链表->红黑树（树化）的条件

结论： ** 你得是第9的元素并且所有元素的数量>=64 才能树化**
下图是部分解释具体细节看putvalue的注释很详细的
在这里插入图片描述
就是你put 一个值叫key 叫a ，找出坐标取出坐标对应的key值假设为b
前面的判断了然后到我图片这里 Bigcount=0 但是你看下一步就是直接指向next 这就是意味着 bigcount=0 对应的是第2个元素！
而进入树化需要 bigcount >=8-1 bigcount=7 对应的是第9个元素
而插入是在判断前操作的 所以你得是第9的元素才能树化

树化条件为什么是8

这个在源码的注释有写：就是 8的时候概率很低了
在这里插入图片描述

红黑树->链表

结论红黑树的数量<=6 就开始链化
在这里插入图片描述

为什么不是 <=7 链化而是6

因为如果是7的话频繁进行插入删除的话会导致容错空间就 8 超过8树化
小于8 链化频繁切换浪费效率。

坐标的计算为什么hash & (length- 1) 不是key & （length-1）

解释多加了一层运算是为了是存储的位置更加的散乱
加的这个hash算法会使得 key的高位也进入到运算之中，如果只是key & （length-1）如果length=16 那这个运算只会和后四位有关15（1111）
到时候数据的分布不会那么的散乱。

modCount

这个变量记录你增删的操作次数用于快速失败fail-fast
这就是为什么你用for each 进行遍历时候如果进行增加删除操作会报错的原因，他会进行迭代器里面记录的和 hahsmap里面记录的这个值比较要是不一样就会报错。
在这里插入图片描述

死循环问题

该问题是1.7的hashmap 进行扩容时，在多线程的情况下，可能产生。粗略可以这样回答：在1.7扩容过程中会新数组会和原来的数组有指针引用关系，所以将引起死循环问题。而1.8的扩容机制将原来的链表结构保存在节点e中，然后依次遍历e,根据hash&n是否等于0,分成两条支链，保存在新数组中。

有新的面试问题会及时更新

Code-zyc

关注

5
点赞
踩
13

收藏

觉得还不错? 一键收藏
5
评论
十分详细的HashMap 源码

目录前置知识重要变量的解释DEFAULT_INITIAL_CAPACITYMAXIMUM_CAPACITYDEFAULT_LOAD_FACTORTREEIFY_THRESHOLDUNTREEIFY_THRESHOLDMIN_TREEIFY_CAPACITY方法开始执行：无参构造创建：有参构建put方法putValue方法resize 初始化或加倍表大小split （扩容时将树进行拆分）untreeify（将节点变成链表）treeify（将节点变成树）treeifyBin(列表进行树化)总结：扩容的条件扩容对
复制链接

扫一扫