********本篇主要介绍了HashMap源码中put方法部分********
下面展示关于 put方法的
HashMap底层源码
。
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
由代码可见:实际上 put 只是套娃了一个 putVal 方法
所以我们要去看一下putVal方法,从putVal方法的参数可以看出,里面包括了一个hash方法,参数为key:
hash(key)
这个方法是干什么的呢?我们来一探究竟。
首先来看看hash(key)的源码
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
这段代码称 扰动函数
作用:让key的hash值的高16位也参与路由寻址运算
举个🌰:
假设 传进来的key的hashcode值赋给h后,h = 0b 0010 0101 1010 1100 0011 1111 0010 1110,根据源码进行^异或运算:
0b 0010 0101 1010 1100 0011 1111 0010 1110 (h)
^
0b 0000 0000 0000 0000 0010 0101 1010 1100 (h >>> 16)
=> 0010 0101 1010 1100 0001 1010 1000 0010
以上运算是为了让高16位和低16位做运算
也算是变相地保留了高位的信息,让高16位也参与路由寻址。
小疑问:h >>> 16是干什么?
答:如果不进行右移运算,没法让高16位与低16位进行运算。
看完了hash方法,可以正式的看一下putVal方法了:每行的注释我已经加进去了…
/**
* Implements Map.put and related methods
*
* @param hash hash for key key的hash值
* @param key the key
* @param value the value to put
* @param onlyIfAbsent if true, don't change existing value 如果散列表当中某一个key和你插入的key是一样的就不插了
* @param evict if false, the table is in creation mode.
* @return previous value, or null if none
*/
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
//tab:引用当前hashmap的散列表
//p:表示当前散列表的元素
//n:表示散列表数组的长度
//i:表示路由寻址的结果
Node<K,V>[] tab; Node<K,V> p; int n, i;
//1号🌰延迟初始化逻辑,第一次调用putVal时会初始化hashMap对象中的最耗费内存的散列表
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
//2号🌰最简单的一种情况:寻址都找到的桶位放好是null,这个时候,应该将当前k-v=>ode 扔进去就行了
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
else {
//e:不为null的话,找到了一个与当前要插入的key-value一致的key元素
//k:表示临时的一个key
Node<K,V> e; K k;
//传进来的hash值等于已经存在p的哈希值 并且传进来的key也和p的key一样
//也就表示当前桶位中的元素,与你当前插入的元素的key完全一致,表示后续需要进行替换操作
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
//p已经树化了
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
//链表的情况,并且链表的头元素与我们要插入的key不一致 我们得遍历链表了
for (int binCount = 0; ; ++binCount) {
//条件成立的话,说明迭代到最后一个元素了,也没找到一个与你要插入的key一致的node
//说明允许加入到当前链表的末尾
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
//如果链表长度大于8 就得进行树化操作了
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
//条件成立的话,说明找到相同key的node元素,break出去 然后进行替换操作
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
//替换操作 e!=null 说明找到了与你插入数据一致的元素,把老value输出,把老值换成新值
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
//表示散列表结构被修改次数,替换node元素的value不计数
++modCount;
//插入新元素,size自增,如果自增后的值大于扩容阈值就扩容
if (++size > threshold)
//3号🌰扩容方法
resize();
afterNodeInsertion(evict);
return null;
}
以上标记🌰的位置是重点:
X位置 | 重点 |
---|---|
1号🌰 | 延迟初始化 |
2号🌰 | (n - 1) & hash 求下标方法 |
3号🌰 | resize() 扩容方法 |
1号🌰
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
如果table为null,那么就初始化table散列表,resize中有扩容方法。
2号🌰
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
如果通过下标运算定位的位置是null,那就直接把key-value扔到该位置就行了。
(n - 1) & hash:下标运算。
补充——核心知识点:为什么 table 的长度 一定是2的幂
计算下标得算法,实际就是取模,hash%length,
计算机中直接求余效率不如位移运算,源码中做了优化hash&(length-1)
要想保证hash%length==hash&(length-1)
那么length必须是2的n次方;
3号🌰
if (++size > threshold)
resize();
size大于负载因子时进行扩容,扩容方法下期讲~~~~
本博客仅供学习参考,也是个人笔记总结,如果错误请见谅~~