树化为红黑树的阈值,固定为8,
树化条件:
1.链表长度>8
2.数组容量>=64,如果数组容量不够大,会先尝试扩容解决链表过长的问题,所以链表长度是可能大于8的,容量到64才会树化
树化阈值为何是8?
随机哈希分布使一个哈希表中的链表长度大于8的几率非常小,除非构造哈希元素,如Dos攻击,不能轻易的树化,因为维护红黑树会消耗更多的性能
红黑树何时退化成链表:
1.在扩容时如果拆分树时,树元素<=6
2.remove节点时,移除之前,如果root,root.left,root.right,root.right.right有一个为bull时,会退化
为什么容量要是2的n次幂:
1.数组扩容计算新索引方便,hash值&原来容量,为0,说明索引没变,如果不为零,则扩容后索引为原始索引+原始容量
2.取模运算可以优化为位运算
有没有缺点?有,比如元素hash值全部为偶数时,%容量后永远是奇数,奇数同理,想要追求更好的hash分布性建议选取容量为质数,并且不需要二次哈希(HashTable 的数组容量就是质数)
例:容量为16,hash 97%16=1 ==》 97&(16-1)
计算下标过程:
计算对象的hashcode()=====>调用HashMap的hash()进行二次哈希======> %容量得到下标索引
为什么要二次哈希?
二次哈希为了综合高位数据,是哈希分布更加均匀 ,避免低位一样导致分布不够随机
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
原始HashCode 右移16为得到高16位,再与自己
HashMap的put流程
1.首次使用才创建数组
2.计算索引(桶下标)
3.如果桶下标还没人占用,创建Node位返回
4.如果桶下标已经有人占用
1)已经是TreeNode,走红黑树的添加或删除的逻辑
2)是普通Node,走链表的添加或更新逻辑,如果链表长度超过树化阈值,走树化逻辑
5.返回前检查容量是否超过阈值,一旦超过进行扩容,先添加新元素再扩容
加载因子为何默认是0.75f
1.在空间占用和查询时间之间取得较好的平衡
2.大于这个值,空间节省了,但链表就会比较长影响性能
3.小于这个值,冲突减少了,但扩容就会更频繁,空间占用多
HashMap的Key有什么要求?
1.HashMap的Key可以为null
2.作为Key的对象必须实现hashCode 和 equals,并且key的内容不能修改