Hash概念:
hash的基本概念就是将任意长度的输入通过hash算法后映射成固定长度的输出。
hash冲突可以避免吗?
理论上无法避免;
hash算法的设计要求:
- 效率要高,要做到从长文本中快速计算出hash值
- 不能逆推原文
- 尽可能散列,降低hash冲突
hashmap每个数据单元都是node结构,node结构中有key字段,value字段,next字段,hash字段,next字段就是当发生hash冲突时生成链表是使用的;
hashmap散列表初始长度:16
散列表是懒加载机制,只有第一次put操作时才会被创建。负载因子是0.75,用来计算扩容阈值,第一次的扩容阈值为12;
链表转红黑树的条件,首先链表长度达到8,其次容量大于64,如果只是链表长度达到8,则只会进行resize操作。
**node内部的hash值是key.hashcode()生成的吗?
**
不是;首先key。hashcode()生成hash值,在将这个hash值得低16位和高16位进行异或运算。
为什么要进行异或运算?
hash寻址算法,散列表的长度必须是2的次幂,寻址算法是hash&(table.lenth-1),通常情况下table的长度不会太大,导致高16未无法参与到运算中,所以通过这种方式提高hash的散列程度,减少hash碰撞。
hashmap put()方法的四种情况:
- solt没有值,直接插入
- solt有值,但是没有链化,使用尾插法加入
- solt已经链化,尾插,之后查看是否达到树化或者扩容条件
- 已经树化,向红黑树添加数据