面试题：HashMap高频面试题

最爱吃鸡肉卷

已于 2022-05-19 09:33:26 修改

阅读量1.2k

点赞数 1

文章标签：哈希算法散列表数据结构

于 2022-05-18 11:12:50 首次发布

本文链接：https://blog.csdn.net/weixin_60347335/article/details/124831241

版权

面试题：HashMap

1、底层数据结构，1.7和1.8有什么区别？
- 1.7是数组+链表，1.8是数组+（链表|红黑树）（链表元素多时转换成红黑树，元素少时转换成链表）
2、为何要用红黑树，为何一上来不树化，树化阈值为何是8，何时会树化，何时会退化为链表？
- 1、红黑树用来避免DoS攻击，防止链表超长时性能下降，树化应当是偶然情况
  - 1、hash表的查找，更新的时间复杂度是O(1)，而红黑树的查找，更新的时间复杂度是O(log₂n)，TreeNode占用空间也比普通Node的大，如非必要，尽量还是使用链表。
  - 2、hash值如果能够随机，则在hash表内按泊松分布，在负载因子0.75的情况下，长度超过8的链表出现概率是0.000 000 06，选择8就是为了让树化几率足够小
- 2、树化的两个条件：链表长度超过树化阈值；数组容量>=64
- 3、退化情况1：在扩容时如果拆分树时，树元素个数<=6则会退化
- 4、退化情况2：remove树节点时，若root、root.right、root.left.left有一个为null，也会退化为链表(是在移除之前检查)
3、索引如何计算？hashCode都有了，为何还要提供hash()方法？数组容量为何是2的n次幂?
- 1、计算对象的hashCode()，再进行调用HashMap的hash()方法进行二次哈希，最后二次哈希结果 &(capacity-1)得到索引
- 2、二次hash()是为了综合高位数据，让哈希分布更均匀，防止超长链表的产生
  
  HashMap二次哈希：
  
  1.8中封装成一个方法：先拿到原始hashCode，然后原始hashCode右移16位（高16位）跟原始hashCode做异或运算，得到二次hash的结果
  
  $[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-pcaXKuO6-1652843256364)(C:\Users\展前进\AppData\Roaming\Typora\typora-user-images\image-20220517211112855.png)]$
  
  1.7：经过多次移位异或得到二次hash
  
  $[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-XHQSgbAC-1652843256365)(C:\Users\展前进\AppData\Roaming\Typora\typora-user-images\image-20220517211640176.png)]$
- 3、计算索引时，如果是2的n次幂可以使用幂运算代替取模，效率更高；扩容时hash &oldCap ==0 的元素留在原来位置，否则新位置 = 旧位置+oldCap
- 4、但1、2、3、都是为了配合容量为2的n次幂的优化手段，例如Hashtable的容量就不是2的n次幂，并不能说哪种设计更优化，应该是设计者综合了各种因素，最终选择了使用2的n次幂作为容量
4、介绍一下put方法的流程，1.7与1.8有何不同？
- HashMap是懒惰创建数组的，首次使用时才创建数组
- 计算索引(桶下标)
- 如果桶下标还没人占用，创建Node占位返回
- 如果桶下标已经有人占用
  - 已经是TreeNode走红黑树的添加或更新逻辑
  - 是普通Node，走链表的添加或更新逻辑，如果链表长度超过树化的阈值，走树化逻辑
- 返回前检查容量是否超过阈值，一旦超过进行扩容
- 不同：
  - 链表插入节点时，1.7是头插法(后插入的在前面)，1.8是尾插法(先插入的在前面)
  - 1.7是大于等于阈值且没有空位时才扩容(没有空位是指，当前这个元素要插的位置已经有元素)、（1.7扩容后链表上元素的顺序还改变），而1.8是大于阈值就扩容
  - 1.8在扩容时计算Node索引时，会优化（就是hash值与旧的数组容量按位与，如果是0位置不要变，不是0要改变位置，新位置=旧索引+旧容量）
5、加载因子为何默认为0.75f
- 在空间占用与查询时间之间取得较好的权衡
- 大于这个值，空间节省了，但链表就会比较长影响性能
- 小于这个值，冲突少了，但扩容就会更频繁，空间占用多
6、多线程下会有啥问题？
- 扩容死链(1.7)

在这里插入图片描述

数据错乱(1.7，1.8)

就是数据被覆盖了造成数据丢失
7、key能否为null,作为key的对象有什么要求
- HashMap的key可以为null，但Map的其他实现则不然
- 作为key的对象，必须实现hashCode和equals，并且key的内容不能修改(不可变)
  - 补充：两个对象hashCode相同不一定equals，但如果equals一个hashCode相同
  - key不能变是因为存入数据时是根据key的hashCode计算它应该放的位置，如果改变key其hashCode可能会变，取数据时取不到
8、String对象的 hashCode() 如何设计的，为啥每次乘的是31
- 目标：是为了达到较为均匀的散列效果，每个字符串的hashCode 足够独特
- 字符串中的每个字符都可以表现为一个数字，称为S_i，其中i的范围是0 ~ n-1
- 散列公式为：S₀*31^n-1+S₁*31^n-2+…+S_i*31^n-1-i+…+S_n-1*31⁰
- 31代入公式有较好的散列特性，并且31*h 可以被优化为：
  - 32*h-h
  - 2⁵*h-h
  - h<<5-h
  计算性能高

最爱吃鸡肉卷

关注

1
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
面试题：HashMap高频面试题

面试题：HashMap底层数据结构，1.7和1.8有什么区别？1.7是数组+链表，1.8是数组+（链表|红黑树）（链表元素多时转换成红黑树，元素少时转换成链表）为何要用红黑树，为何一上来不树化，树化阈值为何是8，何时会树化，何时会退化为链表1、红黑树用来避免DoS攻击，防止链表超长时性能下降，树化应当是偶然情况1、hash表的查找，更新的时间复杂度是O(1)，而红黑树的查找，更新的时间复杂度是O(log2n)，TreeNode占用空间也比普通Node的大，如非必要，尽量还是使用链表
复制链接

扫一扫