1. HashMap 底层数据结构
数组+链表,1.8后为数组+链表,链表大于8后转换为红黑树结构
2. 寻址算法优化
寻址采用是的 hash 值与数组长度,达到快速取模的效果
tab[i = (n - 1) & hash]
ps:因为限制了数组长度是 2^n,所以才可这样取余,这样也解释了为什么扩容也是 2 倍扩容
3. Java 8的 hash 值优化
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
把 hash 值和它的高 16 位进行异或操作,目的是让低 16位具备高16位的特征,从而减少 hash 值冲突。
为什么要改变低 16 位? 因为和数组长度与操作取模时,由于数组长度往往不大,结果就是基本上都是低位参与计算。
4. hash 碰撞问题
也就相当于问 HashMap 结构:数组+链表
链表查询时 O(n),红黑树查询 O(logn)
1.8后在链表长度到 8 就转换为红黑树
5. 扩容相关
2 倍扩容, resize
initialCapacity 为 2 次幂的某个数,参考方法 tableSizeFor
loadFactor 负载因子,默认0.75,threshold = initialCapacity * loadFactor,当map中元素个数大于 threshold时就会进行扩容
6. JDK8 以前并发操作 HashMap 遇到的严重问题
在并发扩容 resize, transfer 时,可能导致链表形成环状,如果下次 get 遍历这个环形链表中不存在的值,它将不断死循环下去查找,导致 cpu 100%
7. JDK8 后是怎么处理的,为什么解决了这个问题
其实 8 以前遇到这个问题可以总结是它使用的是 头插法, 而 8 开始使用的是 尾插法, 但是依然存在很多并发问题比如丢失数据
8. 说说 CurrentHashMap
8 以前用的是 锁分段 技术
8 以后和 HashMap 结构类似,数组+链表/红黑树,并发控制使用 synchronized + CAS
比如:put 时某个数组上 null 时会用 CAS 增添 Node,操作某个 Node 链表时用 synchronized 控制,即锁的是当前链表
核心思想还是其实还是 锁分段