HashMap数据put具体实现过程
- 先计算key的hashCode(key如果为null,hashCode为0,否则取key的hashCode异或hashCode>>>16,高低16位混合保留特征);
- 如果table数组未初始化,则进行初始化,默认是16;
- 计算存放的数组下标(当数组长度是2的n次方时,取模操作hashCode%n 等价于 hashCode & (n - 1) ,提高效率);
- 如果数组下标为null,则newNode,并直接存放在数组下标上;
4.1 如果数组下标元素为红黑树,则遍历红黑树,如果存在元素key相同的情况,则直接进行node的value替换,并返回旧值。否则添加到红黑树;
4.2 如果数组下标元素为链表或单个元素,则遍历链表,存在元素key相同的情况,则直接进行node的value替换,并返回旧值。否则添加添加(当链表个数大于8时,转换成红黑树); - 如果旧值不为空,则返回旧值;否则map数量+1;
- 如果map size 大于 数组长度*0.75,则进行数组扩容,扩容按照2倍扩容(2倍扩容移动元素少,并且取模操作可以转换为按位与操作);
结合代码解析put过程
public V put(K key, V value) {
// 计算hash值,传入putVal()方法
return putVal(hash(key), key, value, false, true);
}
/**
* 1、hash值计算,使用了扰动函数
* 右移16位相当于将高16位移入低16位,再与原来的hashcode做异或运算(位相同位0,不同为1),
* 这样可以将高低为二进制特征混合起来,减少hash碰撞
**/
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
// put的具体流程在该方法中
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
// 2、 如果table数组未初始化,则进行初始化,默认是16
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
// 3、 计算存放的数组下标
if ((p = tab[i = (n - 1) & hash]) == null)
// 4、如果数组下标为null,则newNode,并直接存放在数组下标上
tab[i] = newNode(hash, key, value, null);
else {
Node<K,V> e; K k;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
else if (p instanceof TreeNode)
// 4.1、如果数组下标元素为红黑树,则遍历红黑树,如果存在元素key相同的情况,则直接进行node的value替换,并返回旧值。否则添加到红黑树。
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
// 4.2、如果数组下标元素为链表或单个元素,则遍历链表,存在元素key相同的情况,则直接进行node的value替换,并返回旧值。否则添加添加(当链表个数大于8时,转换成红黑树)
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
// 5、如果旧值不为空,则返回旧值;否则map数量+1.
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
// 不为空时map数量+1
++modCount;
// 6、如果map size 大于 数组长度*0.75,则进行数组扩容,扩容按照2倍扩容(2倍扩容移动元素少,并且取模操作可以转换为按位与操作)。
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
其他
1、为什么槽位数必须使用2^n / 为什么要 &length-1
为了让哈希后的结果更加均匀,减少hash碰撞
2、扩容后Hash值计算
length * 2,即新增的bit位是1,在 (n - 1) & hash 时,只需要判断新增加的这一个bit位,如果是0的话,说明索引不变,如果变成1了,索引变成 原索引+扩容前的容量大小