一 hash()
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
校验key是否为null
1)如果为null则返回0,这也就是为什么hashMap中只能有一个为null的key.
2)不为null,调用Object的hashCode,将返回值带符号右移16位再与返回值进行 ^(按位异或)运算,右移16位得到的高位,与原数进行按位异或,也就是高位与低位进行异或,这样异或的结果的
低位就混合了原始哈希码的高位和低位,加大了低位的随机率,混合后的低位掺杂了高位的部分特征.
注意:定义hashMap的长度时一定要是2的幂次方,因为2的幂次方-1与扰动过的hash值相与得到的低位最大值转换成十进制就是实际的长度,这样就不会出现数组下角标越界了.
二 内部类Node<K,V>
此类继承了Map中的Map.Entry<K,V>,这个类就是实际存的元素,类属性有hash值,key(键),value(值),next(指向下一个元素),其中next是构成链表结构的重要组成元素
三 put()
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
else {
Node<K,V> e; K k;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
tab数组,Node<K,V> p对象,n(tab长度) i(tab下角标),如果类属性table为空或者长度为零,调用resize方法进行扩容.不为空则直接将table的引用赋值给tab,判断tab在(n-1)&hash值
的下角标位置是否存在元素,
不存在直接new一个Node元素.此时next指向为null.
存在分为三种,同一个key,此位置为红黑树,此位置为链表,
同一个key直接覆盖,
此位置为红黑树此处暂时省略.
此位置为链表,执行死循环,首先判断链表第一个元素的next是否为空,为空直接将要放入的node对象直接赋值给next属性,判断当前table长度是否超过树化阈值TREEIFY_THRESHOLD,超过则将链表转换为红黑树结构.如果next属性不为空,判断next的属性与将要插入的hash值,键值对key,value相等,结束循环,否则将next属性赋值给p,继续循环.
e不为空代表是覆盖的情况,所以返回原有的value,设置新的value,结束方法,
为空则是新增,modCount和size加1,如果size加1后大于扩容阈值,执行扩容方法.
返回空,put方法结束
resize方法
final Node<K,V>[] resize() {
Node<K,V>[] oldTab = table;
int oldCap = (oldTab == null) ? 0 : oldTab.length;
int oldThr = threshold;
int newCap, newThr = 0;
if (oldCap > 0) {
if (oldCap >= MAXIMUM_CAPACITY) {
threshold = Integer.MAX_VALUE;
return oldTab;
}
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
oldCap >= DEFAULT_INITIAL_CAPACITY)
newThr = oldThr << 1; // double threshold
}
else if (oldThr > 0) // initial capacity was placed in threshold
newCap = oldThr;
else { // zero initial threshold signifies using defaults
newCap = DEFAULT_INITIAL_CAPACITY;
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
}
if (newThr == 0) {
float ft = (float)newCap * loadFactor;
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
(int)ft : Integer.MAX_VALUE);
}
threshold = newThr;
@SuppressWarnings({"rawtypes","unchecked"})
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
table = newTab;
if (oldTab != null) {
for (int j = 0; j < oldCap; ++j) {
Node<K,V> e;
if ((e = oldTab[j]) != null) {
oldTab[j] = null;
if (e.next == null)
newTab[e.hash & (newCap - 1)] = e;
else if (e instanceof TreeNode)
((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
else { // preserve order
Node<K,V> loHead = null, loTail = null;
Node<K,V> hiHead = null, hiTail = null;
Node<K,V> next;
do {
next = e.next;
if ((e.hash & oldCap) == 0) {
if (loTail == null)
loHead = e;
else
loTail.next = e;
loTail = e;
}
else {
if (hiTail == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
} while ((e = next) != null);
if (loTail != null) {
loTail.next = null;
newTab[j] = loHead;
}
if (hiTail != null) {
hiTail.next = null;
newTab[j + oldCap] = hiHead;
}
}
}
}
}
return newTab;
}
扩容分为三种情况,
1)无参构造创建扩容,此时hashmap对象中只有负载因子loadFactor有值,默认为0.75 (oldCap < 0old && Thr > 0)
else if (oldThr > 0) // initial capacity was placed in threshold
newCap = oldThr;
2)有参构造,指定数组长度和扩容阈值,但是node数组是空的:
else { // zero initial threshold signifies using defaults
newCap = DEFAULT_INITIAL_CAPACITY;
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
}
3)已有数组,达到扩容阈值,即oldCap > 0:
if (oldCap > 0) {
if (oldCap >= MAXIMUM_CAPACITY) {
threshold = Integer.MAX_VALUE;
return oldTab;
}
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
oldCap >= DEFAULT_INITIAL_CAPACITY)
newThr = oldThr << 1; // double threshold
}
if (newThr == 0) {
float ft = (float)newCap * loadFactor;
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
(int)ft : Integer.MAX_VALUE);
}
threshold = newThr;
这里将新的扩容阈值赋值给threshold
@SuppressWarnings({"rawtypes","unchecked"})
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
table = newTab;
if (oldTab != null) {
for (int j = 0; j < oldCap; ++j) {
Node<K,V> e;
if ((e = oldTab[j]) != null) {
oldTab[j] = null;
if (e.next == null)
newTab[e.hash & (newCap - 1)] = e;
else if (e instanceof TreeNode)
((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
else { // preserve order
Node<K,V> loHead = null, loTail = null;
Node<K,V> hiHead = null, hiTail = null;
Node<K,V> next;
do {
next = e.next;
if ((e.hash & oldCap) == 0) {
if (loTail == null)
loHead = e;
else
loTail.next = e;
loTail = e;
}
else {
if (hiTail == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
} while ((e = next) != null);
if (loTail != null) {
loTail.next = null;
newTab[j] = loHead;
}
if (hiTail != null) {
hiTail.next = null;
newTab[j + oldCap] = hiHead;
}
}
}
}
}
这一段就是将旧的数组赋值给新的数据(如果有值的话)new一个新的Node数组并赋值给类属性table
因为旧数组的位置是由 hash & (数组容量-1)得来的,例如初始容量16-1为15,二进制为0000 1111,所以如果hash碰撞的时候后四位肯定是一样的,每次扩容都是数组容量带符号向左移1位也就是乘2.所以每次只需要判断hash & 数组容量是否为0就能得知是留在原下角标还是移像其他位置.
用do-while循环判断每个链表/node是留在原地还是移动其他位置
lo就是扩容后仍然在原地的元素链表
hi就是扩容后下标为 原位置+原容量 的元素链表,从而不需要重新计算hash.
因为扩容后计算存储位置就是 hash & (32 - 1)【取后5位】,但是并不需要再计算一次位置,
此处只需要判断左边新增的那一位(右数第5位)是否为1即可判断此节点是留在原地lo还是移动去高位hi:(e.hash & oldCap) == 0 (oldCap是16也就是10000,相与即取新的那一位)
原理是:利用了尾指针Tail,完成了尾部插入,不会造成逆序,所以也不会产生并发死锁的问题。
这种方法对比1.7中算法的优点是:
1、不管怎么样都不需要重新再计算hash;
2、放过去的链表内元素的相对顺序不会改变;
3、不会在并发扩容中发生死锁。
注意,时间复杂度并没有减少
至此,扩容结束.
tableSizeFor
static final int tableSizeFor(int cap) {
int n = cap - 1;
n |= n >>> 1;
n |= n >>> 2;
n |= n >>> 4;
n |= n >>> 8;
n |= n >>> 16;
return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}
这个方法的作用是获取比传入参数大的最小2的幂次方的数,
首先java中的int占4个字节,每个字节8位,即32位,
|= 符号表示或操作, 利用或的作用把从最高位的1开始向右全部赋值为1
n |= n >>> 1;这行代码是将最高位的1右边一位赋值为1
n |= n >>> 2;这行代码是将最高位到第四位全部赋值为1
以此类推,如果32位的第一位是1的话最终算出来的数字为
11111111 11111111 11111111 11111111 方法最后将这个数字+1,刚好是比当前数字大的最小2的幂次方.
putVal方法
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
//将类属性table赋值给tab,如果table为空或者长度为0,重新扩容table
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
if ((p = tab[i = (n - 1) & hash]) == null)
//如果存储位置为空,直接new一个Node对象,放进去
tab[i] = newNode(hash, key, value, null);
else {
//存储位置不为空,分三种情况,与该位置的key的hash值相等且key相等,将p赋值给e
Node<K,V> e; K k;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
else if (p instanceof TreeNode)//如果p是TreeNode类型,尝试放入红黑树中,重复则返回TreeNode对象.
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
//循环判断链表中是否有重复的值,判断元素的next属性为空,直接new一个Node插入到next属性中,如果此时元素的个数是否超过树化值,超过则转换成红黑树.
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
//如果与next的hash值且key相等,结束循环,等待下边覆盖此位置的值
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
//将next属性赋值给p进行下一轮循环判断直到找到重复的或者next属性为空
p = e;
}
}
if (e != null) { // existing mapping for key 存在则为此值覆盖
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
//如果size加一后大于扩容阈值,再次扩容
if (++size > threshold)
resize();
afterNodeInsertion(evict);
//新增的数组位置,返回值为null
return null;
}