Java集合干货——HashMap源码分析

最新推荐文章于 2025-05-15 19:00:00 发布

原创

最新推荐文章于 2025-05-15 19:00:00 发布 · 215 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#Java集合干货 #hashmap #源码分析

本文详细分析了Java集合类HashMap的源码，包括HashMap的基本概况、非线程安全的原因、与Hashtable的区别、put操作的实现、哈希表碰撞攻击及扩容机制。通过阅读源码，深入了解HashMap的工作原理和优化策略。

似乎所有的java面试或者考察都绕不开hash，准确说是必问集合，问集合必问hash表。

虽然一直以来都经常的使用HashMap，但是却一直没有看过源码，可能是没有意识到阅读源码的好处，经过分析，发现阅读源码让自己对集合有了更加深刻的了解，因此会一直将这个系列进行下去，这次要说的是HashMap。

HashMap的基本概况

HashMap是一个Hash表，其数据以键值对的结构进行存储，在遇到冲突的时候会使用链表来进行解决，JDK8以后引入了红黑树的模式，具体会在文中分析。

其次，HashMap是非线程安全的，Key和Value都允许为空，Key重复会覆盖、Value允许重复。

补充一句，在多线程下我们可以使用concurrentHashMap。

HashMap和Hashtable的区别：

（HashMap和Hashtable）

HashMap定义

public class HashMap<K,V> extends AbstractMap<K,V> implements Map<K,V>, Cloneable, Serializable

HashMap没有什么要说的，直接切入正题，初始化一个HashMap。

初始化

HashMap map = new HashMap();

通过这个方法会调用HashMap的无参构造方法。

//两个常量 向下追踪
public HashMap() {
  this(DEFAULT_INITIAL_CAPACITY, DEFAULT_LOAD_FACTOR);
}

//无参构造创建对象之后 会有两个常量
//DEFAULT_INITIAL_CAPACITY 默认初始化容量 16  这里值得借鉴的是位运算
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
//DEFAULT_LOAD_FACTOR 负载因子默认为0.75f 负载因子和扩容有关 后文详谈
static final float DEFAULT_LOAD_FACTOR = 0.75f;

//最大容量为2的30次方
static final int MAXIMUM_CAPACITY = 1 << 30;

//以Node<K,V>为元素的数组，长度必须为2的n次幂
transient Node<K,V>[] table;

//已经储存的Node<key,value>的数量，包括数组中的和链表中的，逻辑长度
transient int size;

threshold 决定能放入的数据量，一般情况下等于 Capacity * LoadFactor

通过上述代码我们不难发现，HashMap的底层还是数组（注意，数组会在第一次put的时候通过 resize() 函数进行分配），数组的长度为2的N次幂。

在HashMap中，哈希桶数组table的长度length大小必须为2的n次方(一定是合数)，这是一种非常规的设计，常规的设计是把桶的大小设计为素数。

相对来说素数导致冲突的概率要小于合数，Hashtable初始化桶大小为11，就是桶大小设计为素数的应用（Hashtable扩容后不能保证还是素数）。