万字图文——HashMap源码解析（包含红黑树）

爪哇缪斯

已于 2022-05-20 22:27:32 修改

阅读量502

点赞数 2

分类专栏：源码解析文章标签： java hashmap 源码

于 2021-12-12 17:14:40 首次发布

本文链接：https://blog.csdn.net/qq_26470817/article/details/121890240

版权

源码解析专栏收录该内容

13 篇文章 6 订阅

订阅专栏

更多好文，可关注公众号【爪哇缪斯】，第一时间好文推送。

〇、储备知识之红黑树

0.1> 2-3树

红黑树是一种自平衡的二叉树，它可以避免二分搜索树在极端的情况下蜕化成链表的情况。那么什么是红黑树呢？要想便于了解红黑树，我们先了解一下跟它息息相关的2-3树。
2-3树是一种绝对平衡的多叉树，在这棵树中，任意一个节点，它的左右子树的高度是相同的。如下所示：

正如上面介绍过的，2-3树是一个多叉树。那为什么叫做2-3树呢？ 因为规则定义，2-3树分为两种节点，分别为：2-节点和3-节点。其中，2-节点表示节点中保存一个元素，3-节点则表示节点中保存两个元素。
我们来演示一下如何生成一个2-3树。

- 首先：向2-3树中插入30和25

- 当再插入37的时候，一个节点就容纳了3个元素了，那么就要进行分裂操作了，如下所示：

- 然后，我们再插入20和33，可以正常的容纳这两个元素

- 我们再继续插入17和43，那么出现了两个节点都分别容纳了3个元素，那么这两个节点都需要进行分裂操作了

- 插入27和35，两个节点都可以容纳这两个新插入的元素

- 那么再最后插入22，结果发现，一个节点容纳了3个元素，要进行分裂，但是分裂后，叶子节点的高度不一致了，那么就要再进行聚合操作，如下所示：

那么，我们了解完2-3树之后，我回过头来看一下红黑树，也就是说，2-3树怎么转变成红黑树呢？方式很多，此处我们可以采用左倾红黑树的方式，来将2-3树转换为红黑树，转换规则如下：

我们可以根据上面的转换规则，进行转换操作。下图是我们上面讲2-3树的时候，构造的。

那么我们按照规则进行转换，如下所示：

我们按照树形结构进行修整，那么就是我们今天要介绍的红黑树。如下所示：

0.2> 红黑树

我们已经了解了如何从2-3树转变为红黑树，那么，什么样的树才叫红黑树呢？难道把节点标记为红色和黑色就是红黑树了吗？当然不是！如果想称为红黑树的一员，一定要满足以下五个条件：（面试很重要！！！）

条件一：每个节点要么是红色，要么是黑色。
条件二：根节点一定是黑色的。

条件三：每个叶子节点一定是黑色。
条件四：如果一个节点是红色，那么它的左右子节点一定都是黑色的。

条件五：从任意一个节点到叶子节点，所经过的黑色节点的数量一样多。

那有的同学肯定会问，条件三里面的描述，说每个叶子节点一定是黑色，但是你上面从2-3树转变的红黑树，叶子节点也不全都是黑色啊。比如33这个节点不就是红色吗？这个问题其实很好，那难道上面的红黑树是错误的吗？其实不是的，因为没有画上空叶子（即：NULL LEAF），所以，33并不是叶子节点。红黑树的叶子节点是黑色的NULL LEAF。完整的红黑树，如下所示：

那么HashMap中是如何构建红黑树的呢？我们不要着急，下面的源码解析中，你会看到它的身影。

一、源码概述

当我们掌握了红黑树的理论知识之后，下面我们就来开始分析HashMap的源码了。那我们从哪里开始入手呢？要回答这个问题，那么就要从我们最常使用HashMap的场景出发了。当我们想要是用HashMap的时候，我们首先会通过HashMap的构造方法创建HashMap，然后通过put方法向HashMap对象赋值。那么我们就可以通过构造函数+put这两点进行源码的切入点。

1.1> HashMap的构造函数

我们先来看HashMap的构造方法。

通过源码我们可以看到只有一行代码，即：给loadFactor赋值。
那么loadFactor是什么呢？它是HashMap的加载因子，也就是说，元素所占的空间达到加载因子的规定值的时候，那么就会执行扩容。

那么初始化加载因子的时候，赋值给它DEFAULT_LOAD_FACTOR属性了。DEFAULT_LOAD_FACTOR这个值是多少呢？我们去源码中寻找答案。

通过上面截图，我们知道了，加载因子默认被赋值为0.75f，那么其实大部分同学都是知道HashMap的结构在JDK8之前是【数组+链表】，而从JDK8之后，存储结构就变为了【数组+链表+红黑树】了。那么这个0.75的含义就是：如果数组中存储的元素长度达到了原长度的75%或者3/4的话，那么就需要执行扩容操作了。
构造函数就这么一行代码，即：给loadFactor赋值为0.75f。是不是很简单。那我们看完了构造函数的代码，我们就来把视角转到put方法吧。

1.2> put方法

在介绍put方法之前，我们先看这个方法的源码，如下所示：

put方法里面，只是调用了putVal方法，如下是putVal方法：

正如上面源码截图中所描述的，整个putVal一共执行了三部分内容，分别是：

1> 创建table数组

2> 向table数组中赋值，这里面分为哈希不冲突和哈希冲突两种情况。

3> 如果超过阈值，则进行扩容操作。

那么，下面就针对这三部分进行详细说明。

二、创建table数组

创建table数组的代码如下所示：

【解释】

在if判断中，当table数组（即：底层存储HashMap元素的数组）等于null或者table数组的长度为0，那么就执行resize()方法进行扩容操作。

那么我们来看resize方法，方法代码如下：

resize方法里面代码逻辑比较多，主要分为两大部分：

第一部分：就是我上面截图中的这部分，这部分内容主要是针对旧的数组来确定新扩容的数组容量、阈值，然后创建新的table数组。
第二部分：那么就是if (oldTab != null) {...} 这部分的代码内容，这里主要是要针对旧的table数组及链表或红黑树向新的table数组中迁移的过程，因为新的table数组长度改变了，那么自然而然会导致hash寻址的时候有些元素位置产生了变化，那么就要设计到拆分链表或红黑树的操作。而且，其中如果分裂后的长度变小到一定的程度，那么原本的红黑树也会蜕化为链表，这部分详细的内容，当我们讲到红黑树那块代码的时候再详细去说。

那么针对于我们第一次往HashMap中插入数据这个场景来说呢，本来就没有所谓的旧table数组，所以第二部分的数据迁移跟我们就没什么关系了，所以，我们暂时只需要关注第一部分就可以了。
如果想看懂第一部分，我们需要先把变量的含义介绍清楚，才更有利于我们了解源码的具体逻辑：

【全局变量】

table：当前所使用的table数组。
threshold：当前所使用的table数组的阈值。

loadFactor：当前所使用的table数组的加载因子。

【局部变量】

oldTab：表示旧的table数组。
oldThr：表示旧table数组的阈值。

oldCap：表示旧table数组的容量/长度。
newTab：表示新的table数组。

newThr：表示新table数组的阈值。
newCap：表示新table数组的容量/长度。

ok，上面做了这么多的铺垫，我们来分步骤来看一下每段代码。

Node<K,V>[] oldTab = table;
int oldCap = (oldTab == null) ? 0 : oldTab.length;
int oldThr = threshold;
int newCap, newThr = 0;

【解释】

由于我们是第一次调用put方法，所以table还没有被初始化，那么它是为null的，所以oldTab也等于null，oldCap就等于0了。
threshold的默认值是0，所以oldThr也等于0。

我们继续来看下面的三个判断代码（为了使代码更美观，此处格式化了代码，并且去除了原有的英文注释）

if (oldCap > 0) {
    if (oldCap >= MAXIMUM_CAPACITY) {
        threshold = Integer.MAX_VALUE;
        return oldTab;
    }
    else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY && oldCap >= DEFAULT_INITIAL_CAPACITY) {
        newThr = oldThr << 1; 
    }
}
else if (oldThr > 0) {
    newCap = oldThr;
}
else {               
    newCap = DEFAULT_INITIAL_CAPACITY;
    newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
}

【解释】

判断1：如果旧的table数组长度大于0（即：oldCap > 0）

- case1：

如果旧table数组长度大于等于最大容量（MAXIMUM_CAPACITY），那么阈值threshold就被赋值为Integer的最大值，返回旧的table数组。

Integer.MAX_VALUE的值为2的31次方减1，也就是二进制的 0111 1111 1111 1111 1111 1111 1111 1111。

MAXIMUM_CAPACITY的默认值为1<<30，那么它表示的二进制为1000 0000 0000 0000 0000 0000 0000 0000。

- case2：

newCap = oldCap << 1表示将oldCap左移1位，其实也就是按照oldCap*2来扩容为newCap。

如果满足以下两个条件，则新的阈值（newThr）也扩容为旧阈值（oldThr）的2倍：

条件1：新的table数组容量（newCap）小于MAXIMUM_CAPACITY

条件2：旧的table数组容量（oldCap）大于等于DEFAULT_INITIAL_CAPACITY（默认值为：16）

DEFAULT_INITIAL_CAPACITY的默认值如下所示：

判断2：如果旧的table数组阈值大于0（即：oldThr > 0）

如果旧的table数组容量不大于0并且它的阈值还大于0，那么说明什么呢？

说明table数组太大了，以至于长度越界了，出现了从整数变为了负数的情况。

如果这种情况发生了，那么就将旧的table数组的阈值作为新table数组的容量进行赋值，相当于适度的进行长度修复。

判断3：如果上面条件都不满足，就执行判断3

其实通过上面判断1和判断2的分析，我们应该可以得出如下结论：那么就是当table数组没有被初始化创建的时候，就会进入到判断3的代码。在这里，会做两件事：

1> 将新的table数组长度赋值为DEFAULT_INITIAL_CAPACITY。（这个默认值为16，上面源码截图中已经粘贴出来了）

2> 将新的table数组的阈值赋值为DEFAULT_INITIAL_CAPACITY*DEFAULT_INITIAL_CAPACITY=16*0.75=12。

DEFAULT_INITIAL_CAPACITY默认值为0.75f，这个也在上面截图中也粘贴出来了。

确定新的table数组容量（newCap）和新的table数组的阈值（newThr）之后，我们来继续看下面的代码：

if (newThr == 0) {
    float ft = (float)newCap * loadFactor;
    newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ? (int)ft : Integer.MAX_VALUE);
}

【解释】

其实这块代码，主要是为上面【判断2：如果旧的table数组阈值大于0（即：oldThr > 0）】服务的，因为上面也说过了，逻辑进入到判断2，说明旧的table数组太大了导致越界从超级大的整数变为了负数。那么，由于代码块里只是对newCap赋值了，并没有赋值newThr，所以这块逻辑中，newThr的值依然是0，满足if条件。
首先通过ft=0.75f*newCap，计算出新的阈值，那么下面就要进行一系列的判断，代码挺长的，但是逻辑很简单。就是说如果我这次计算出来的新的阈值（ft）小于最大容量（MAXIMUM_CAPACITY），那么就作为新的阈值了。否则，那么就默认赋值为Integer的最大值了（Integer.MAX_VALUE）

其实我们能够看出来，上面的一堆代码逻辑其实就是在做一件事儿——确定新的table数组的容量（newCap）和阈值（newThr），为了下面真正要创建新的table数组做准备。

threshold = newThr;
@SuppressWarnings({"rawtypes","unchecked"})
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
table = newTab;

【解释】

这部分代码就没什么好说的了，就是创建新的table数组，并且更新全局变量threshold和table，因为这两个值表示的就是当前“生效”或“正在使用”的table数组和阈值。

下面的if (oldTab != null) 代码块我们就不在【二、创建table数组】展开了，因为这部分代码是对于之前已经创建过table数组的逻辑来说的，我们会在下面的章节部分展开说明。那么table数组创建完毕了，就该插入数据了吧？是的，那我们进入【三、向table数组中插入元素】这部分吧。

三、向table数组中插入元素

3.1> 没有发生哈希冲突

当我们向HashMap中插入元素的时候，其实我们最希望看到的就是没有任何的哈希冲突，即可以直接插入到table数组中。那么如果真的非常“幸运”被我们赶上了，那么下面的代码就是：

if ((p = tab[i = (n - 1) & hash]) == null) {
    tab[i] = newNode(hash, key, value, null);
}

Node<K,V> newNode(int hash, K key, V value, Node<K,V> next) {
    return new Node<>(hash, key, value, next);
}

【解释】

通过(n - 1) & hash来寻址，找到待插入的位置i，这里的tab就是table数组，那么发现tab[i]==null，也就是待插入的位置是空的，那就太好了，我们直接插入就可以了。所以，先通过newNode方法构建Node节点，然后放到table数组对应的位置i上面。

3.2> 发生了哈希冲突

但是，大多情况下，插入的元素都会发生哈希冲突，那么如果发生了怎么办呢？对于JDK8来说，就会以链表或红黑树的方式进行数据存储。我们先从整体方面看一下这块代码。

3.2.1> 冲突的节点与待插入的节点key值相同

这种情况，其实也是我们比较喜欢看到的。因为不涉及到红黑树和链表，只是把旧的Node节点取出来赋值给e。

if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k)))) {
    e = p;
}

在putVal方法的最后，会有一段如下的逻辑处理：

【解释】

在覆盖旧值之前，需要判断onlyIfAbsent是不是为false，这个值是什么意思呢？其实它就是putVal的第4个入参，我们调用put方法的时候，put方法里默认是传onlyIfAbsent=false的。所以它的含义是，如果我们要覆盖旧值，则onlyIfAbsent=false，如果不覆盖，则onlyIfAbsent=true。

3.2.2> 向红黑树中插入元素

讲完直接覆盖旧值的处理方式之后，那么这部分我们就来先介绍以红黑树的方式解决哈希冲突，这部分代码很多，我们一步步来拆分分析。代码如下所示：

else if (p instanceof TreeNode) {
    e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
}

这里判断，如果p这个值时TreeNode类型的，那么就现在这个结构是红黑树了，那么就往红黑树中插入了。p就是我们上面通过hash寻址获得得应该插入的下标i，然后从tab[i]中获得的元素。讲到这里，我们先来介绍一下HashMap底层的两个数据结构。
首先是TreeNode，它的结构如下所示：

【解释】

从源码中我们可以看出来，TreeNode其实包含两部分内容：

- 1> 树结构（父节点：parent，左子节点：left，右子节点：right）
- 2> 链表结构（前指针：prev，后指针：next）

next指针是在TreeNode祖父类HashMap.Node里面定义的。

我们来继续看putTreeVal方法的具体实现

【解释】

根据上面源码截图的红框注释，可以将putTreeVal方法分为5部分来说明，分别是：

1> 寻址根节点
2> 确定插入位置

3> 构造TreeNode并插入到相应的子节点位置
4> 红黑树平衡调整

5> moveRootToFront

下面我们就来一一介绍：

3.2.3.1> 寻址根节点

由于我们要将待插入的节点放到红黑树中，所以我们需要先从根节点出发，寻找待插入的位置，那么下面代码就是负责这部分内容的：

TreeNode<K,V> root = (parent != null) ? root() : this;

parent代表父节点，那它是谁的父节点呢？我们是通过调用p的putTreeVal来执行的，那么就是p的父节点，还记得p是吧？即：p=tab[i]，也就是table数组中i位置上的元素。如下所示：

那么如果p的父节点等于null，就说明自己就是root根节点了，如果不等于null，就说明root根节点另有它人。就需要调用root()方法来进行查找了。

【解释】

那么root()方法的逻辑就是，顺着p的父类往上查找父类，直到找到一个节点它没有父节点，那么这个节点就是root节点了。

3.2.3.2> 确定插入位置

这部分代码如下所示：

for (TreeNode<K,V> p = root;;) {
    int dir, ph; K pk;
    if ((ph = p.hash) > h)
        dir = -1;
    else if (ph < h)
        dir = 1;
    else if ((pk = p.key) == k || (k != null && k.equals(pk)))
        return p;
    else if ((kc == null &&
              (kc = comparableClassFor(k)) == null) ||
             (dir = compareComparables(kc, k, pk)) == 0) {
        if (!searched) {
            TreeNode<K,V> q, ch;
            searched = true;
            if (((ch = p.left) != null &&
                 (q = ch.find(h, k, kc)) != null) ||
                ((ch = p.right) != null &&
                 (q = ch.find(h, k, kc)) != null))
                return q;
        }
        dir = tieBreakOrder(k, pk);
    }
	... ...
}

这部分代码看着挺多的，但是逻辑很简单，就是对比p节点的hash值与待插入元素的hash值，如果p节点hash值大，则说明待插入的元素在p节点的左侧，如果p节点hash值小，则说明待插入的元素在p节点的右侧。如果p节点的key值就是我们待插入的key值，那么就好办了，我们直接把这个p节点作为方法的返回值return就可以了。我们可以看到最外层的for循环是无限循环的，那么就说明，每一次循环，都会慢慢的向下寻找，直到找到一个节点，它的左节点或者右节点是可以插入新Node的，那么就插入了。这个过程就像我们搜索二叉树中某个值的过程是一样的。这块没有什么难点，我们继续往下看。

3.2.3.3> 构造TreeNode并插入到相应的子节点位置

这部分代码如下所示：

TreeNode<K,V> xp = p;
if ((p = (dir <= 0) ? p.left : p.right) == null) {
    Node<K,V> xpn = xp.next;
    TreeNode<K,V> x = map.newTreeNode(h, k, v, xpn);
    if (dir <= 0)
        xp.left = x;
    else
        xp.right = x;
    xp.next = x;
    x.parent = x.prev = xp;
    if (xpn != null)
        ((TreeNode<K,V>)xpn).prev = x;
    ... ...
}

通过上面的计算，我们得出一个dir的值，它就是用来表示在节点的左侧还是右侧。

dir=-1：表示待插入节点在p节点的左侧。
dir=1：表示待插入的节点在p节点的右侧。

要讲这块代码，我们还需要再介绍一下局部变量值的含义：

x表示待插入的树节点。
xp表示x节点的parent节点。

xpn表示xp的next节点，即后置节点。

那么此处我们假设dir=-1，也就是说我们要把待插入的节点放到树节点的左侧，那么如果p.left等于null，说明p是没有左子节点的，那么我们就可以执行插入操作了，即：满足了if里面的判断。
然后构建一个全新的TreeNode，并维护双向链表。这里需要关注的是map.newTreeNode(h, k, v, xpn)，第四个xpn就表示要我们新建节点x链接到xp节点的后面，然后将xpn链接到x节点的后面，如下所示：

当然，除了维护好双向链表之外，最重要的，当然是将x插入到xp的左侧，即：xp.left = x;
好的，新节点也建好了，双向链表也维护好了，树节点也插入完毕了。但是，这个新的树结构真的满足红黑树的要求吗？不满足怎么办呢？那么想要说明白这个问题，就需要进入下一章节——红黑树平衡调整balanceInsertion(root, x)来一探究竟了。

3.2.3.4> 红黑树平衡调整

这部分代码主要就是调整树结构，使得可以构建成一个合法的红黑树，代码如下所示：

这块代码相信大家看到注释后，也觉得有点懵了。但这就是对红黑树进行调整的计算逻辑。针对下面这段代码，应该不用过多解释了：

if ((xp = x.parent) == null) {
    x.red = false;
    return x;
}
else if (!xp.red || (xpp = xp.parent) == null) 
    return root;

主要的逻辑，其实都是在下面的代码块中：

if (xp == (xppl = xpp.left)) {
    if ((xppr = xpp.right) != null && xppr.red) {
        xppr.red = false;
        xp.red = false;
        xpp.red = true;
        x = xpp;
    }
    else {
        if (x == xp.right) {
            root = rotateLeft(root, x = xp);
            xpp = (xp = x.parent) == null ? null : xp.parent;
        }
        if (xp != null) {
            xp.red = false;
            if (xpp != null) {
                xpp.red = true;
                root = rotateRight(root, xpp);
            }
        }
    }
}
else {
    if (xppl != null && xppl.red) {
        xppl.red = false;
        xp.red = false;
        xpp.red = true;
        x = xpp;
    }
    else {
        if (x == xp.left) {
            root = rotateRight(root, x = xp);
            xpp = (xp = x.parent) == null ? null : xp.parent;
        }
        if (xp != null) {
            xp.red = false;
            if (xpp != null) {
                xpp.red = true;
                root = rotateLeft(root, xpp);
            }
        }
    }
}

以上的代码，其实总的分为如下部分：

部分一：如果x的父节点在祖父节点的左侧

- 操作类型一：变色

操作条件：如果祖父节点的右节点是红色的（其实作为祖父节点的左节点也是红色的）

- 操作类型二：旋转+变色

部分二：如果x的父节点在祖父节点的右侧

- 操作类型一：变色

操作条件：如果祖父节点的做节点是红色的（其实作为祖父节点的右节点也是红色的）

- 操作类型二：旋转+变色

那么其实我们就可以只针对变色操作和旋转+变色这两种操作逐一分析即可，为了便于大家更好的理解，这块我不以文字而是采用图例的方式来说明了。

a> 变色操作

b> 旋转+变色操作

c> 左旋操作rotateLeft

d> 右旋操作rotateRight

了解了上面的各种场景和左旋右旋，我们可以举个例子，某个横向链表添加了8个元素从A到H，当再插入I的时候，由于超出了8个，所以会执行resize操作，那么我们假设table数组的长度大于等于64，是满足从链表转换为红黑树的条件的。我们来模拟一下转换过程，当然，由于转换过程画得我确实太累了，我实在画不懂了，那么就画到F元素就不画了，不过不影响大家理解。转换图如下所示：

3.2.3.5> moveRootToFront

那么讲完红黑树的平衡操作后，就需要执行moveRootToFront方法的，这个方法从名字上能够看出来，就是将root节点放到整条双向链表的头部，并插入到table数组中。这块的双向链表大家不要理解错，与我们常说的HashMap是有链表+红黑树组成的那个链表不是一个概念哈。那个链表是单向链表。
相关代码如下所示：

这块逻辑就比较简单了，需要讲的内容我都标注到了上方源码截图中了。那么整个处理流程，我们依然采用图例的方式来叙述一下吧。如下所示：

3.2.3> 像单向链表中插入元素

上面介绍的红黑树，是当已经转换完红黑树之后再插入数据的操作。那么就像我们刚刚new了一个HashMap对象，然后开始插入元素的时候，是会先以单向链表方式存储的。那么它所涉及的代码如下所示：

我们可以从上面的源码截图看到，for里面是一个无限循环，也就是说，会从p节点开始，一直调用next去遍历链表中的每一个元素，只要遇到了和待插入的key值相同的节点，则break出无限for循环。如果都没有与待插入的key值相同，则创建新的Node，插入到链表的结尾。
当然，还有一个限制，就是binCount >= TREEIFY_THRESHOLD - 1，首先我们要说明的是，binCount是从0开始的，那么其实对应的是链表中的第2个元素，而TREEIFY_THRESHOLD默认值为8，则只要binCount >= 8-1，则尝试转变红黑树（是否转变，还要看treeifyBin里面的逻辑）。那么当binCount >=7的时候，其实就是链表中的元素已经超过8个了。下面，我们就来着重看一下treeifyBin方法的实现逻辑是什么？

3.2.3.1> treeifyBin

相关源码如下所示：

【解释】

treeifyBin可以分为两部分逻辑：

- 1> 如果table数组长度小于64，则只扩容table数组，不转换为红黑树。
- 2> 否则，将链表转换为红黑树。

那么针对这两部分逻辑，我们逐一进行分析。

a> 针对table数组进行扩容

这部分逻辑代码都在resize()方法中，它的源码如下所示：

上面的处理逻辑已经标注到了源码截图上，那么我们暂时先不看split方法，因为涉及到了红黑树的分裂，我们先把视角关注在链表的分裂迁移上，还是按照惯例，我们依然以图示来说明具体处理流程。我们尝试往新建的HashMap里存放数据，直到出发扩容。
首先，我们执行put(0, "a0")和put(1,""a1)，那么HashMap的存储方式是这样的：

那么我们继续执行put方法，put(16, "a16"), put(32, "a32"), put(48, "a48"), put(64, "a64"), put(80, "a80"), put(96, "a96"), put(112, "a112") 那么存储结构如下图所示：

由于下标为0的位置只是存储了8个节点，并没有出发扩容，那么我们就继续往下标为0的位置插入元素，即：put(128, "a128")，那么下标为0的位置达到了9个元素，满足了触发扩容的条件，但是由于table数组的长度为16，所以不会转为红黑树。扩容和数据迁移后，存储结构如下所示：

从上面的途中我们可以看到，原本长度为9的链表，被拆分成了两条链表，其中：低位链表保存了5个节点的数据，高位链表保存了4个节点的数据。
我们介绍完链表的分裂和迁移之后，就来再回过头看一下 ((TreeNode<K,V>)e).split(this, newTab, j, oldCap)的处理逻辑吧。split的源码如下所示：

我们看到，其实针对红黑树的拆分方式与单向链表的拆分方式异曲同工，都是将一个整体拆分为高位和低位两部分。那么不同的是，当拆分后的高低位双向链表中存储的数据小于等于6个的时候，那么就没有必要使用红黑树的结构了，因为红黑树的特点是，在大数据量的情况下，查询比链表快太多了，但是由于每次插入或者删除节点，都需要重新调整红黑树的结构，以满足红黑树的约束，所以，这方面没有链表速度快。所以，当元素很少的情况下，就直接采用链表了。这部分涉及了untreeity方法，我们看一下untreeity的源码：

【解释】

这块逻辑其实就没啥说的了，就是遍历TreeNode双向链表，把每个节点转变为Node类型的节点，然后再拼装成一个单向链表即可。

上面说的是将整个链表拆分为高低位两链条表后，元素较少的情况会进行红黑树转为单向链表，那么如果这两条链表数据依然很多怎么办呢？那么就把这两部分创建两个新的红黑树就可以了。这部分设计的方式是treeify()，源码如下所示：

看完上图的注释，其实我们应该能够感受到，这个跟我们在【3.2.2 向红黑树中插入元素】中介绍的内容是一样的。其实就是三个步骤：

步骤一：将待插入的节点插入到红黑树中。
步骤二：由于树形结构变化了，所以要对红黑树的平衡进行调整。

步骤三：如果由于对红黑树进行了调整，有可能造成root节点的变化，那么就要把最新的root节点放到双向链表的头部，并插入到table数组中。

b> 链表转换为红黑树

我们介绍完链表的扩容后，来介绍一下红黑树的转换，由于上面介绍resize()方法的内容比较多，担心同学们已经忘记这部分要讲的源码是什么，我们再来用红框标注一下，如下所示：

在红框标注的部分中，我们又见到了treeify方法了，这个就是我们刚刚介绍完的方法，用来构造红黑树的。
那么这部分代码不多，内容也简单明了，就是将链表中的每个节点Node转换为TreeNode类型，并调用treeify方法构造红黑树。treeify方法由于上面已经有详细的介绍了，此处就不做过多的赘述了。

四、执行table扩容操作

那么当我们一直往HashMap中插入元素的时候，总会有把table数组填满的时候，那么table数组容量越小，针对大量数据就需要构建横向链表或红黑树，也就是说，哈希冲突就越容易发生。为了减少这种情况发生，table会根据约定好的阈值，即总容量的2/3或0.75，如果超过了这个阈值，则会进行table数组的扩容操作，代码如下所示：