一、了解HashMap底层存储机制是什么?
- HashMap采用 数组 + 链表 + 红黑树作为存储结构,原理如下:
- HashMap中的每一个元素(KV键值对),都会被封装成一个内部类Entry对象。该对象存有key(键)、value(值)、next(下一个元素)、hash(哈希值);
- HashMap底层是一个默认长度16的数组,在数组中保存Entry对象;
- 每次存储元素(Entry对象)时,根据使用key值进行hash后计算hash值 通过(长度-1)&hash 得到这个元素在数组中的位置下标,如果数组该位置上已经存放有其他元素(产生哈希冲突),那么在这个位置上的元素将以链表的形式存故,使用next指向新添加的元素,形成链表;(链地址法)
- JDK1.8 开始,HashMap在解决哈希冲突时有了较大变化,当链表长度大于國值(默认为8)并且数组长度大于64,将链表转化为红黑树,减少搜索时间:
数组类型为Node[]
链地址法:哈希表中的每个Node节点都有一个next指针,构成一个单向链表。被分配到同一个下标位置上的多个Node节点(发生哈希冲突),可以通过存入同一个单向链表来解决哈希冲突问题。
二、HashMap的put()方法
- 判断数组table是否为空,如果为空进行初始化;
- 如果不为空,使用hash方法计算key的hashCode,通过(n-1) & hash计算应当存放在数组中的下标index;
- 查看table[index]是否存在数据;
- 如果没有数据,就构造一个Node<K,V>节点,存放在table[index]中;
- 如果存在数据,说明发生哈希冲突,继续判断key是否相等;
- 如果相等,用新的value替换原数据;
- 如果不相等,判断当前节点类型是不是TreeNode<K,V>树型节点
- 如果是树型节点,创造树型节点插入红黑树中;
- 如果不是树型节点,创建普通Node<KV>加入链表尾部;
- 判断链表长度大于值(默认为8)并且数组长度大于64,如果满足,链表转换为红黑树;如果不满足,数组扩容;
- 最后,插入完成之后,判断当前节点数是否大于实际存储空间大小;
- 如果大于,调用resize(),按原数组的长度,扩容一倍。
三、小扩展
1.HashMap 的长度为什么是2的幂次方?
当HashMap中的数组长度为2的幂次方,不同的key计算得到index相间的几率较小,不容易产生冲突;
并且与索引计算公式为i = (n-1)& hash配合使用,如果n为2的幂次方,那么n-1的低位就全是1,哈希值进行与操作时可以保证低位的值不变,从而保证分布均匀,效果等同于hash%n,但是位运算比“%”模运算要高效的多;
2. HashMap影响性能的两个参数?
构建HashMap实例时有两个重要的容数,会影响其性能:初始容量和加载因子
初始容量用来规定哈希表数组的长度,默认为16,因为16是2的整数次幂的原因,在小数据量的情况下,能减少哈希冲突,提高性能。在存储大容量数据的时候,最好预先判断数据量,按照2的幂次方,提问预设初始容量;
加载因子用来表示哈希表中元素的填满程度,默认为0.75,越大则表示允许填满的元素就越多,哈希表的空间利用率就越高,但是冲突的机会增加。反之,越小则冲突的机会就会越少,但是空问很多就浪费。
所以,在设置初始容量时,应该考虑到初始容量及其加载因子,预估设置初始容量,最大限度地减少rehash重建内部数据结构操作的次数,减少扩容操作。
总结: 以上就是对于当put添加一个键值对元素时,HashMap发生了什么?的分享,如有不当之处还请大家多多评论指正,喜欢文章的可以留下您的关注和点赞,一起学习,一起加油!