HashMap由数组+链表组成的,数组是HashMap的主体,链表则是主要为了解决哈希冲突而存在的,如果定位到的数组位置不含链表(当前entry的next指向null),那么对于查找,添加等操作很快,仅需一次寻址即可;如果定位到的数组包含链表,对于添加操作,其时间复杂度为O(n),首先遍历链表,存在即覆盖,否则新增;对于查找操作来讲,仍需遍历链表,然后通过key对象的equals方法逐一比对查找。所以,性能考虑,HashMap中的链表出现越少,性能才会越好。
/**
* Implements Map.put and related methods
*
* @param hash hash for key
* @param key the key
* @param value the value to put
* @param onlyIfAbsent if true, don't change existing value
* @param evict if false, the table is in creation mode.
* @return previous value, or null if none
*/
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
else {
Node<K,V> e; K k;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
个人总结:从hashMap的put方法入手分析
- hashMap初始化是在put方法中包括扩容,调用resize()方法
if (oldCap > 0) { if (oldCap >= MAXIMUM_CAPACITY) { threshold = Integer.MAX_VALUE; return oldTab; } else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY && oldCap >= DEFAULT_INITIAL_CAPACITY) newThr = oldThr << 1; // 扩容两倍 } else if (oldThr > 0) //oldCap =0且阈值大于0的情况 初始值限定为阈值 newCap = oldThr; else { // 默认 newCap = DEFAULT_INITIAL_CAPACITY; newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY); /** *这里的为负载因子和初始值来确定下一个阈值, * 类似于充电宝额定20000毫安的电池实际只有13000左右的容量 *在putVal()源码中 if (++size > threshold) resize(); * 这段判断如果size大小到了这个容量阈值了就该 *扩容了这里就涉及到碰撞了 * --负载因子过大,实际容量越大,扩容操作减少, * 碰撞变的越来越多,性能严重下降 *负载因子过小,实际容量越小,扩容变得过于频繁, * 从新计算hash遍历,扩容带来的性能开销也将变得越来越大。 *所以有时候无脑用默认值还是挺爽的 * */ } if (newThr == 0) { float ft = (float)newCap * loadFactor; newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ? (int)ft : Integer.MAX_VALUE); } threshold = newThr; @SuppressWarnings({"rawtypes","unchecked"}) Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap]; table = newTab;
- 通过key的hash和 Node数组的最大下标按位与操作来确定node数组位置
此处要说到initialCapacity这个值的影响了,这个值初始化的时候建议为2的整数倍,上述表达式中是按位与操作,如果不是2的整数倍的话,n-1 转化成二进制时末尾就会出现0 比如15-1=14 对应二进制1110 这时候与操作永远也取不到尾数为1的二进制数,也就会浪费空间,增加碰撞概率了。
- 当碰撞到达默认8时会树化,应该是优化吧,哈哈
直接存为树节点了