hashmap 扩容是元素还是数组_深入理解HashMap的扩容机制

最新推荐文章于 2023-06-28 15:18:28 发布

weixin_39625468

最新推荐文章于 2023-06-28 15:18:28 发布

阅读量1.3k

点赞数 4

文章标签： hashmap 扩容是元素还是数组

本文链接：https://blog.csdn.net/weixin_39625468/article/details/111786776

版权

Java 7 中Hashmap扩容机制

一、什么时候扩容：

网上总结的会有很多，但大多都总结的不够完整或者不够准确。大多数可能值说了满足我下面条件一的情况。

扩容必须满足两个条件：

1、存放新值的时候当前已有元素的个数必须大于等于阈值

2、存放新值的时候当前存放数据发生hash碰撞(当前key计算的hash值换算出来的数组下标位置已经存在值)

二、下面我们看源码，如下：

首先是put()方法

在put()方法中有调用addEntry()方法，这个方法里面是具体的存值，在存值之前还要判断是否需要扩容

如果需要扩容，调用扩容的方法resize()

transfer()在实际扩容时候把原来数组中的元素放入新的数组中

三、总结：

Hashmap的扩容需要满足两个条件：当前数据存储的数量(即size())大小必须大于等于阈值；当前加入的数据是否发生了hash冲突。

因为上面这两个条件，所以存在下面这些情况

(1)、就是hashmap在存值的时候(默认大小为16，负载因子0.75，阈值12)，可能达到最后存满16个值的时候，再存入第17个值才会发生扩容现象，因为前16个值，每个值在底层数组中分别占据一个位置，并没有发生hash碰撞。

(2)、当然也有可能存储更多值(超多16个值，最多可以存26个值)都还没有扩容。原理：前11个值全部hash碰撞，存到数组的同一个位置(虽然hash冲突，但是这时元素个数小于阈值12，并没有同时满足扩容的两个条件。所以不会扩容)，后面所有存入的15个值全部分散到数组剩下的15个位置(这时元素个数大于等于阈值，但是每次存入的元素并没有发生hash碰撞，也没有同时满足扩容的两个条件，所以叶不会扩容)，前面11+15=26，所以在存入第27个值的时候才同时满足上面两个条件，这时候才会发生扩容现象。

Java 8 中Hashmap扩容机制

一、Java8的扩容机制：

Java8不再像Java7中那样需要满足两个条件，Java8中扩容只需要满足一个条件：当前存放新值(注意不是替换已有元素位置时)的时候已有元素的个数大于等于阈值(已有元素等于阈值，下一个存放后必然触发扩容机制)

注：

(1)扩容一定是放入新值的时候，该新值不是替换以前位置的情况下(说明：put(“name”,"zhangsan")，而map里面原有数据，则该存放过程就是替换一个原有值，而不是新增值，则不会扩容)

(2)扩容发生在存放后，即是数据存放后(先存放后扩容)，判断当前存入对象的个数，如果大于阈值则进行扩容。

二、背静知识：

Java7中Hashmap底层采用的是Entry对数组，而每一个Entry对又向下延伸是一个链表，在链表上的每一个Entry对不仅存储着自己的key/value值，还存了前一个和后一个Entry对的地址。

Java8中的Hashmap底层结构有一定的变化，还是使用的数组，但是数组的对象以前是Entry对，现在换成了Node对象(可以理解是Entry对，结构一样，存储时也会存key/value键值对、前一个和后一个Node的地址)，以前所有的Entry向下延伸都是链表，Java8变成链表和红黑树的组合，数据少量存入的时候优先还是链表，当链表长度大于8，且总数据量大于64的时候，链表就会转化成红黑树，所以你会看到Java8的Hashmap的数据存储是链表+红黑树的组合，如果数据量小于64则只有链表，如果数据量大于64，且某一个数组下标数据量大于8，那么该处即为红黑树。

三、源码：

在jdk7中，当new Hashmap()的时候会对对象进行初始化，而jdk8中new Hashmap()并没有对对象进行初始化，而是在put()方法中通过判断对象是否为空，如果为空通过调用resize()来初始化对象。

public V put(K key, V value) {

return putVal(hash(key), key, value, false, true);

}

/**

* Implements Map.put and related methods

* @param hash key值计算传来的下标

* @param key

* @param value

* @param onlyIfAbsent true只是在值为空的时候存储数据，false都存储数据

* @param evict

* @return 返回被覆盖的值，如果没有覆盖则返回null

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,

boolean evict) {

// 申明entry数组对象tab[]:当前Entry[]对象

Node[] tab;

// 申明entry对象p:这里表示存放的单个节点

Node p;

// n:为当前Entry对象长度

// i:为当前存放对象节点的位置下标

int n, i;

/**

* 流程判断

* 1、如果当前Node数组(tab)为空，则直接创建(通过resize()创建)，并将当前创建后的长度设置给n

* 2、如果要存放对象所在位置的Node节点为空，则直接将对象存放位置创建新Node，并将值直接存入

* 3、存放的Node数组不为空，且存放的下标节点Node不为空(该Node节点为链表的首节点)

* 1)比较链表的首节点存放的对象和当前存放对象是否为同一个对象，如果是则直接覆盖并将原来的值返回

* 2)如果不是分两种情况

* (1)存储处节点为红黑树node结构，调用方法putTreeVal()直接将数据插入

* (2)不是红黑树，则表示为链表，则进行遍历

* A.如果存入的链表下一个位置为空，则先将值直接存入，存入后检查当前存入位置是否已经大于链表的第8个位置

* a.如果大于,调用treeifyBin方法判断是扩容还是需要将该链表转红黑树(大于8且总数据量大于64则转红黑色，否则对数组进行扩容)

* b.当前存入位置链表长度没有大于8，则存入成功，终端循环操作。

* B.如果存入链表的下一个位置有值，且该值和存入对象“一样”，则直接覆盖，并将原来的值返回

* 上面AB两种情况执行完成后，判断返回的原对象是否为空，如果不为空，则将原对象的原始value返回

* 上面123三种情况下，如果没有覆盖原值，则表示新增存入数据，存储数据完成后，size+1,然后判断当前数据量是否大于阈值，

* 如果大于阈值，则进行扩容。

if ((tab = table) == null || (n = tab.length) == 0)

n = (tab = resize()).length;

if ((p = tab[i = (n - 1) & hash]) == null)

tab[i] = newNode(hash, key, value, null);

else {

Node e; K k;

if (p.hash == hash &&

((k = p.key) == key || (key != null && key.equals(k))))

e = p;

else if (p instanceof TreeNode)

// 按照红黑树直接将数据存入

e = ((TreeNode)p).putTreeVal(this, tab, hash, key, value);

else {

for (int binCount = 0; ; ++binCount) {

if ((e = p.next) == null) {

p.next = newNode(hash, key, value, null);

if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st

treeifyBin(tab, hash);//该方法判断是扩容还是需要将该链表转红黑树

break;

}

if (e.hash == hash &&

((k = e.key) == key || (key != null && key.equals(k))))

break;

p = e;

}

if (e != null) { // existing mapping for key

V oldValue = e.value;

if (!onlyIfAbsent || oldValue == null)

e.value = value;

afterNodeAccess(e);

return oldValue;

}

++modCount;

// 如果不是替换数据存入，而是新增位置存入后，则将map的size进行加1，然后判断容量是否超过阈值，超过则扩容

if (++size > threshold)

resize();

afterNodeInsertion(evict);

return null;

}

treeifyBin()方法判断是扩容还是将当前链表转红黑树

/**

* Replaces all linked nodes in bin at index for given hash unless

* table is too small, in which case resizes instead.

* 从指定hash位置处的链表nodes头部开始，全部替换成红黑树结构。

* 除非整个数组对象(Map集合)数据量很小(小于64)，该情况下则通过resize()对这个Map进行扩容，而代替将链表转红黑树的操作。

final void treeifyBin(HashMap.Node[] tab, int hash) {

int n, index; HashMap.Node e;

// 如果Map为空或者当前存入数据n(可以理解为map的size())的数量小于64便进行扩容

if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)

resize();

// 如果size()大于64则将正在存入的该值所在链表转化成红黑树

else if ((e = tab[index = (n - 1) & hash]) != null) {

HashMap.TreeNode hd = null, tl = null;

do {

HashMap.TreeNode p = replacementTreeNode(e, null);

if (tl == null)

hd = p;

else {

p.prev = tl;

tl.next = p;

}

tl = p;

} while ((e = e.next) != null);

if ((tab[index] = hd) != null)

hd.treeify(tab);

}

四、总结：

(1)Java 8 在新增数据存入成功后进行扩容

(2)扩容会发生在两种情况下(满足任意一种条件即发生扩容)：

a 当前存入数据大于阈值即发生扩容

b 存入数据到某一条链表上，此时数据大于8，且总数量小于64即发生扩容

(3)此外需要注意一点java7是在存入数据前进行判断是否扩容，而java8是在存入数据库在进行扩容的判断。

Java8 HashMap扩容可参考：https://blog.csdn.net/goosson/article/details/81029729 (注：该文章中关于Java8 底层数据结构描述不准确，只有当数据量大于64才会有红黑树+链表)

这里补充一下jdk8关于红黑树和链表的知识：

第一次添加元素的时候，默认初期长度为16，当往map中继续添加元素的时候，通过hash值跟数组长度取“与”来决定放在数组的哪个位置，如果出现放在同一个位置的时候，优先以链表的形式存放，在同一个位置的个数又达到了8个(代码是>=7,从0开始，及第8个开始判断是否转化成红黑树)，如果数组的长度还小于64的时候，则会扩容数组。如果数组的长度大于等于64的话，才会将该节点的链表转换成树。在扩容完成之后，如果某个节点的是树，同时现在该节点的个数又小于等于6个了，则会将该树转为链表。

weixin_39625468

关注

4
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
hashmap 扩容是元素还是数组_深入理解HashMap的扩容机制

Java 7 中Hashmap扩容机制一、什么时候扩容：网上总结的会有很多，但大多都总结的不够完整或者不够准确。大多数可能值说了满足我下面条件一的情况。扩容必须满足两个条件：1、存放新值的时候当前已有元素的个数必须大于等于阈值2、存放新值的时候当前存放数据发生hash碰撞(当前key计算的hash值换算出来的数组下标位置已经存在值)二、下面我们看源码，如下：首先是put()方法在put()方法...
复制链接

扫一扫

hashmap 扩容是元素还是数组_深入理解HashMap的扩容机制

“相关推荐”对你有帮助么？