put()方法完整逻辑图
HashMap 插入元素逻辑
- 调用key的hashCode方法计算出hash值,再和数组长度-1按位与得到哈希表的下标,判断桶是否为null,为null直接插入
- 桶存在,就产生了hash冲突,接下来和桶上的元素比较hash值是否相同,如果不一致,新建一个结点来存储,如果一致,那么再调用equals判断内容相等,相等则覆盖,不相等继续往下找,如果都不相等,再新建结点存储数据
代码详解
// 负载因子,默认0.75 防止hash冲突过于严重。比如当键值对数量达到达到capacity*loadFactor后就会进行扩容。loadFactor=键值对数目(size)/数组长度(capacity)
final float loadFactor;
// 当桶的元素个数大于等于8且数组长度大于64进行树化,否则进行扩容;从空间时间考虑,利用泊松分布,大于等于8的情况很少
static final int TREEIFY_THRESHOLD = 8;
// 当桶的元素小于等于6重新转换成链表
static final int UNTREEIFY_THRESHOLD = 6;
// 只有桶的个数达到64才会进行树化,还没达到则应该扩容而不是树形化
static final int MIN_TREEIFY_CAPACITY = 64;
// 存储元素的数组,总是2的幂次倍,当hash&(len-1)可减少hash冲突,且其值与取余相同,即hash值%len==hash&(len-1),且性能更高
transient Node<K,V>[] table;
// 阈值(threshold)=数组容量(capacity)*负载因子(loadFactor),键值对数量阈值,超过就会进行扩容,
int threshold;
// 键值对的数目
transient int size;
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16); // 原理:最终通过hash&(len-1)计算桶的位置,假设len-1=111,这样按位与操作只用到了hash值得后四位,如果hash值高位变化很大,低位变化很小,那么hash冲突就会很严重。经过右移按位异或后,高位和低位就都有用到了
}
// 先比较hashCode是否相同,再比较是否是同个对象或者equals()相同
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
// 如果桶位存在
if ((p = tab[i = (n - 1) & hash]) == null) // 先判断hash之后的桶位是否存在,为null直接新建node
tab[i] = newNode(hash, key, value, null);// 重写hashCode之后才会字面量相同的key才会映射到同一个桶上
// 如果桶位不存在
else {
Node<K,V> e; K k;
// hashCode是否相等并且地址或equals要相等
if (p.hash == hash && // 比较hash值是否相等,并且key的地址或equals方法要相等
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
else if (p instanceof TreeNode) // 是否是红黑树结点类型,是直接插入
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
// 若链表长度大于等于8
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
// 转化为红黑树
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e; // 记录下一个结点
}
}
if (e != null) { // 找到了相同的key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value; // 进行覆盖
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
if (++size > threshold) // 如果键值对长度大于阈值,扩容
resize();
afterNodeInsertion(evict);
return null;
}
保证容量的最小2的幂次方数
// 得到大于给定的最小2的幂次方数
static final int tableSizeFor(int cap) {
int n = cap - 1;
n |= n >>> 1;
n |= n >>> 2;
n |= n >>> 4;
n |= n >>> 8;
n |= n >>> 16; // 把首位1右边全部置为1,再加一
return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}
hashCode()用于获取哈希码(散列码),eauqls()用于比较两个对象是否相等,它们应遵守如下规定:
- 如果两个对象相等,则它们必须有相同的哈希码。
- 如果两个对象有相同的哈希码,则它们未必相等。
重写equals一定要hashCode方法
保证equals相等的两个对象hashCode(默认比较地址)一定要相等