HashMap、HashTable、HashSet简介

最新推荐文章于 2023-12-04 13:03:03 发布

Jeled

最新推荐文章于 2023-12-04 13:03:03 发布

阅读量897

点赞数 1

分类专栏：学习笔记面试 android 文章标签： android java 哈希算法

本文链接：https://blog.csdn.net/qq_41821190/article/details/121405602

版权

android 同时被 3 个专栏收录

54 篇文章 1 订阅

订阅专栏

学习笔记

26 篇文章 0 订阅

订阅专栏

面试

18 篇文章 0 订阅

订阅专栏

Hash是Map接口的实现Hash允许空的key_value键值对，HashMap被人认为是Hashtable加强版，HashMap非线程安全，所以当多个线程对同一个HashMap进行操作时，需要加同步锁，可以是Collections.synchroniredMap(new HashMap)来创建一个线程安全的Map，如果想构造线程安全的Map可以考虑ConcurrenHashMap。因为HashMap是无序的，因为HashMap无法保证内部存储的键值对的有序性。

HashMap的底层数据结构是数组 + 链表的集合体，数组在HashMap中又被称为桶（bucket）

HashMap有两个很重要的因素：

初始容量：初始容量指的就是 hash 表桶的数量
负载因子：负载因子是一种衡量哈希表填充程度的标准

HashMap和HashTable的区别：

相同点：

都是基于哈希表实现，其内部每个元素都是key_value键值对，都实现了Map、Cloneable、Serializable接口

不同点：

父类不同：HashMap继承AbstractMap类，而HashTable继承Dictionary类
空值不同：HashMap运行空的key和value值，HashTable不允许空的key和value值。HashMap会把Null key当做普通的key对待，不允许null key重复。
线程安全：HashMap不是线程安全的，HashTable线程安全
性能方面：虽然HashMap和HashTable都是基于单链表的，但是HashMap进行put和get操作，可以达到常数时间的性能；而HashTable的put和get操作都是加了synchronized锁的，所以效率很差
初始容量不同：HashTable 的初始长度是11，之后每次扩充容量变为之前的 2n+1（n为上一次的长度）而 HashMap 的初始长度为16，之后每次扩充变为原来的两倍。创建时，如果给定了容量初始值，那么HashTable 会直接使用你给定的大小，而 HashMap 会将其扩充为2的幂次方大小。

HashMap和HashSet的区别：

HashSet 继承于 AbstractSet 接口，实现了 Set、Cloneable,、java.io.Serializable 接口。HashSet 不允许集合中出现重复的值。HashSet 底层其实就是 HashMap，所有对 HashSet 的操作其实就是对 HashMap 的操作。所以 HashSet 也不保证集合的顺序。

关于 HashMap 的面试题

HashMap 的数据结构

JDK1.7 中，HashMap 采用位桶 + 链表的实现，即使用链表来处理冲突，同一 hash 值的链表都存储在一个数组中。但是当位于一个桶中的元素较多，即 hash 值相等的元素较多时，通过 key 值依次查找的效率较低。

所以，与 JDK 1.7 相比，JDK 1.8 在底层结构方面做了一些改变，当每个桶中元素大于 8 的时候，会转变为红黑树，目的就是优化查询效率。

HashMap 的 put 过程

大致过程如下，首先会使用 hash 方法计算对象的哈希码，根据哈希码来确定在 bucket 中存放的位置，如果 bucket 中没有 Node 节点则直接进行 put，如果对应 bucket 已经有 Node 节点，会对链表长度进行分析，判断长度是否大于 8，如果链表长度小于 8 ，在 JDK1.7 前会使用头插法，在 JDK1.8 之后更改为尾插法。如果链表长度大于 8 会进行树化操作，把链表转换为红黑树，在红黑树上进行存储。

HashMap 为啥线程不安全

HashMap 不是一个线程安全的容器，不安全性体现在多线程并发对 HashMap 进行 put 操作上。如果有两个线程 A 和 B ，首先 A 希望插入一个键值对到 HashMap 中，在决定好桶的位置进行 put 时，此时 A 的时间片正好用完了，轮到 B 运行，B 运行后执行和 A 一样的操作，只不过 B 成功把键值对插入进去了。如果 A 和 B 插入的位置（桶）是一样的，那么线程 A 继续执行后就会覆盖 B 的记录，造成了数据不一致问题。

还有一点在于 HashMap 在扩容时，因 resize 方法会形成环，造成死循环，导致 CPU 飙高。

HashMap 是如何处理哈希碰撞的

HashMap 底层是使用位桶 + 链表实现的，位桶决定元素的插入位置，位桶是由 hash 方法决定的，当多个元素的 hash 计算得到相同的哈希值后，HashMap 会把多个 Node 元素都放在对应的位桶中，形成链表，这种处理哈希碰撞的方式被称为链地址法。

其他处理 hash 碰撞的方式还有「开放地址法、rehash 方法、建立一个公共溢出区」这几种方法。

HashMap 是如何 get 元素的

首先会检查 table 中的元素是否为空，然后根据 hash 算出指定 key 的位置。然后检查链表的第一个元素是否为空，如果不为空，是否匹配，如果匹配，直接返回这条记录；如果匹配，再判断下一个元素的值是否为 null，为空直接返回，如果不为空，再判断是否是 TreeNode 实例，如果是 TreeNode 实例，则直接使用 TreeNode.getTreeNode 取出元素，否则执行循环，直到下一个元素为 null 位置。

HashMap 和 HashTable 有什么区别

见上

HashMap 和 HashSet 的区别

见上

HashMap 是如何扩容的

HashMap 中有两个非常重要的变量，一个是 loadFactor ，一个是 threshold ，loadFactor 表示的就是负载因子，threshold 表示的是下一次要扩容的阈值，当 threshold = loadFactor * 数组长度时，数组长度扩大位原来的两倍，来重新调整 map 的大小，并将原来的对象放入新的 bucket 数组中。

HashMap 的长度为什么是 2 的幂次方

这道题我想了几天，之前和群里小伙伴们探讨每日一题的时候，问他们为什么 length%hash == (n - 1) & hash，它们说相等的前提是 length 的长度 2 的幂次方，然后我回了一句难道 length 还能不是 2 的幂次方吗？其实是我没有搞懂因果关系，因为 HashMap 的长度是 2 的幂次方，所以使用余数来判断在桶中的下标。如果 length 的长度不是 2 的幂次方，小伙伴们可以举个例子来试试。

例如长度为 9 时候，3 & (9-1) = 0，2 & (9-1) = 0 ，都在 0 上，碰撞了；

这样会增大 HashMap 碰撞的几率。

HashMap 线程安全的实现有哪些

因为 HashMap 不是一个线程安全的容器，所以并发场景下推荐使用 ConcurrentHashMap ，或者使用线程安全的 HashMap，使用 Collections 包下的线程安全的容器，比如说

Collections.synchronizedMap(new HashMap());

还可以使用 HashTable ，它也是线程安全的容器，基于 key-value 存储，经常用 HashMap 和 HashTable 做比较就是因为 HashTable 的数据结构和 HashMap 相同。

上面效率最高的就是 ConcurrentHashMap。

文章并没有叙述太多关于红黑树的构造、包含添加、删除、树化等过程，一方面是自己能力还达不到，一方面是关于红黑树的描述太过于占据篇幅，红黑树又是很大的一部分内容，所以会考虑放在后续的红黑树进行讲解。

Jeled

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
HashMap、HashTable、HashSet简介

Hash是Map接口的实现Hash允许空的key_value键值对，HashMap被人认为是Hashtable加强版，HashMap非线程安全，所以当多个线程对同一个HashMap进行操作时，需要加同步锁，可以是Collections.synchroniredMap(new HashMap)来创建一个线程安全的Map，如果想构造线程安全的Map可以考虑ConcurrenHashMap。因为HashMap是无序的，因为HashMap无法保证内部存储的键值对的有序性。HashMap的底层数据结构是数组
复制链接

扫一扫

专栏目录