前言
在 Java 开发中,HashMap
和 ConcurrentHashMap
是常用的键值对存储工具。无论是本地缓存还是并发计数器,它们都各有千秋。
一、什么是 HashMap 和 ConcurrentHashMap?
1. HashMap
HashMap
是 Java 集合框架中的经典实现,基于哈希表存储键值对。它高效、灵活,但非线程安全,适合单线程环境。
- 核心特点:
- 允许
null
键和值。 - 平均时间复杂度 O(1),最坏情况 O(log n)(红黑树)。
- 无序存储,不保证键值对顺序。
- 允许
2. ConcurrentHashMap
ConcurrentHashMap
是为并发环境设计的线程安全版本,基于哈希表但优化了并发性能。它在多线程场景下表现优异,广泛用于高并发应用。
- 核心特点:
- 不允许
null
键或值。 - 提供线程安全的并发操作。
- 支持高并发读写,读操作通常无锁。
- 不允许
二、核心区别:原理与实现
1. 数据结构
两者底层都采用 数组 + 链表 + 红黑树(JDK 1.8),但并发控制机制不同。
- HashMap:无并发控制,所有操作直接作用于数组。
- ConcurrentHashMap:通过细粒度锁和 CAS(Compare And Swap)实现并发安全。
2. 线程安全性
- HashMap:
- 非线程安全,多线程操作可能导致数据不一致。例如,扩容时可能出现死循环(JDK 1.7)或数据覆盖。
- 若需线程安全,需外部加锁(如
Collections.synchronizedMap
),但性能较低。
- ConcurrentHashMap:
- 线程安全,JDK 1.8 使用 CAS + 同步锁:
- 读操作无锁,基于
volatile
保证可见性。 - 写操作锁定单个桶,减少锁竞争。
- 扩容支持多线程协作。
- 读操作无锁,基于
- 比加锁的
HashMap
性能更高。
- 线程安全,JDK 1.8 使用 CAS + 同步锁:
3. Null 值支持
- HashMap:允许一个
null
键和多个null
值。 - ConcurrentHashMap:禁止
null
键和值,因为null
在并发环境下可能导致语义歧义(如区分不存在的键和null
值)。
4. 迭代行为
- HashMap:
- 迭代器是 fail-fast 的,若迭代期间结构被修改(增删元素),会抛出
ConcurrentModificationException
。
- 迭代器是 fail-fast 的,若迭代期间结构被修改(增删元素),会抛出
- ConcurrentHashMap:
- 迭代器是 弱一致性 的,反映迭代开始时的状态,不保证后续修改可见,且不会抛出异常。
5. 扩容机制
- HashMap:单线程扩容,容量翻倍后重新分配键值对,期间可能阻塞。
- ConcurrentHashMap:支持多线程协作扩容,动态分配任务,读写操作受影响较小。
三、性能对比
- HashMap:
- 单线程环境下性能最佳,无并发控制开销。
- 适合小规模数据或明确单线程场景。
- ConcurrentHashMap:
- 多线程环境下性能优于加锁的
HashMap
,因其细粒度锁和无锁读操作。 - 读操作接近 O(1),写操作因锁略有开销。
- 多线程环境下性能优于加锁的
性能对比图:
四、代码示例
以下是一个对比两者的代码示例,展示基本操作和并发场景:
import java.util.HashMap;
import java.util.concurrent.ConcurrentHashMap;
public class MapDemo {
public static void main(String[] args) {
// HashMap 示例
HashMap<String, String> hashMap = new HashMap<>();
hashMap.put(null, "nullValue"); // 允许 null
hashMap.put("key1", "value1");
System.out.println("HashMap: " + hashMap);
// ConcurrentHashMap 示例
ConcurrentHashMap<String, String> concurrentMap = new ConcurrentHashMap<>();
concurrentMap.put("key1", "value1");
concurrentMap.putIfAbsent("key1", "newValue"); // 不会覆盖
// concurrentMap.put(null, "value"); // 抛出 NullPointerException
System.out.println("ConcurrentHashMap: " + concurrentMap);
// 多线程测试 ConcurrentHashMap
ConcurrentHashMap<String, Integer> counter = new ConcurrentHashMap<>();
Runnable task = () -> {
for (int i = 0; i < 1000; i++) {
counter.compute("count", (k, v) -> v == null ? 1 : v + 1);
}
};
Thread t1 = new Thread(task);
Thread t2 = new Thread(task);
t1.start();
t2.start();
try {
t1.join();
t2.join();
} catch (InterruptedException e) {
e.printStackTrace();
}
System.out.println("ConcurrentHashMap count: " + counter.get("count"));
}
}
输出:
HashMap: {null=nullValue, key1=value1}
ConcurrentHashMap: {key1=value1}
ConcurrentHashMap count: 2000
说明:
HashMap
允许null
键,适合单线程。ConcurrentHashMap
的putIfAbsent
和compute
方法支持并发操作,计数器示例展示了线程安全。
五、适用场景
1. 选择 HashMap
- 场景:
- 单线程环境,如本地缓存、配置存储。
- 性能要求极高且能保证线程安全。
- 示例:解析用户输入的表单数据,存储为键值对。
2. 选择 ConcurrentHashMap
- 场景:
- 多线程环境,如并发缓存、计数器、任务调度。
- 需要高并发读写,避免手动加锁。
- 示例:Web 应用中统计在线用户数或缓存用户信息。
六、常见问题解答
1. 为什么 ConcurrentHashMap 不允许 null?
null
在并发环境下可能导致语义不明确。例如,无法区分“键不存在”和“值为 null”。HashMap
因单线程环境无此问题。
2. ConcurrentHashMap 的性能为何优于加锁的 HashMap?
ConcurrentHashMap
使用细粒度锁(锁定单个桶)和 CAS 机制,减少锁竞争,而 Collections.synchronizedMap
对整个对象加锁,性能较低。
3. 什么时候用红黑树?
当链表长度超过 8 且数组容量大于 64,两者都会将链表转为红黑树以提高查询效率(O(log n) vs O(n))。
七、总结
HashMap
和 ConcurrentHashMap
各有优势,选择时需根据线程安全和性能需求权衡:
- HashMap:单线程首选,性能高,允许
null
,但多线程需手动同步。 - ConcurrentHashMap:多线程神器,线程安全,高并发性能优异,适合缓存和计数器场景。
理解两者的原理和适用场景,能帮助你编写更高效的 Java 代码。希望这篇文章为你解惑!欢迎在评论区留言交流,分享你的使用经验!