一、ConcurrentHashMap
ConcurrentHashMap
是 Java 中的一个线程安全的哈希表实现。它提供了对哈希表进行并发操作的支持,是 HashMap
的线程安全版本。ConcurrentHashMap
在 JDK 5 中引入,为了解决多线程环境下使用 HashMap
可能导致的并发访问问题。
特点
线程安全性:
ConcurrentHashMap
是线程安全的,可以被多个线程同时使用而不需要额外的同步措施。这是通过采用一种分段锁(Segment-based approach)的方式实现的,不同的段(Segment)可以被不同的线程同时访问,从而提高并发性能。
分段锁:
ConcurrentHashMap
将整个数据结构划分为多个段,每个段拥有一个独立的锁。这样,在进行读写操作时,只需要锁住对应的段,而不是整个数据结构。这有效地减小了锁的粒度,提高了并发度。
并发度:
并发度是指在同一时刻允许多少个线程同时进行读操作。ConcurrentHashMap
的并发度可以通过调整初始容量和负载因子来进行配置。更高的并发度意味着更多的线程可以同时执行读操作,从而提高了性能。
线程安全的迭代器:
ConcurrentHashMap
提供了线程安全的迭代器。由于在迭代期间其他线程可能对映射进行修改,因此 ConcurrentHashMap
的迭代器在被创建后不会抛出 ConcurrentModificationException
异常。
不允许 null 键和值:
ConcurrentHashMap
不允许 null 键和值。
如果尝试插入 null 键或值,会抛出 NullPointerException
。
原子操作:
ConcurrentHashMap
提供了一些原子操作,如 putIfAbsent(key, value)
和
remove(key, value)
,这些操作是以原子方式执行的,可以保证在多线程环境下的正确性。
性能优化:
针对读操作和写操作的优化进行了细致的设计,以提高并发性能。在读取数据时,不需要加锁,而在写操作时采用分段锁的方式,使得读操作和写操作可以并发执行。
总结:
ConcurrentHashMap
提供了在多线程环境中安全、高效地进行哈希表操作的机制,适用于需要并发访问的场景。
二、HashMap
HashMap
是 Java 中的一种集合类,它实现了 Map
接口,用于存储键值对。
特点
数据结构:
HashMap
是基于哈希表的数据结构实现的。它使用哈希算法来计算键的哈希码,然后将键值对存储在哈希表的相应位置。这使得 HashMap
具有快速的查找性能。
键值对:
HashMap
存储的数据是键值对(key-value pair)。每个键都唯一,而值则可以重复。通过键可以快速查找对应的值。
无序性:
HashMap
中的元素是无序的,即它不保证元素的顺序。如果需要有序的集合,可以考虑使用 LinkedHashMap
,它保留了元素插入的顺序。
允许 null 键和值:
HashMap
允许键和值都为 null。这意味着可以将 null 作为键插入 HashMap
中,并且可以通过 null 键获取对应的值。
线程不安全:
HashMap
不是线程安全的,如果多个线程同时访问一个 HashMap
实例,且至少有一个线程修改了该 HashMap
的结构(增加或删除元素),那么必须通过外部同步手段来保证 HashMap
的线程安全性,或者使用 Collections.synchronizedMap(Map)
方法使其变为线程安全的。
初始化容量和负载因子:
HashMap
可以通过初始容量和负载因子来进行初始化。初始容量是哈希表的容量,负载因子是在哈希表达到多满的时候进行扩容。调整这两个参数可以在一定程度上影响 HashMap
的性能。
性能优势:
HashMap
提供了常数时间的平均复杂度的查找、插入和删除操作。这是通过哈希表的设计实现的,使得元素的存储位置和键的哈希码之间建立了映射关系。
迭代性能:
在 HashMap
中进行迭代的性能相对较好,因为哈希表的设计使得迭代操作的开销相对较小。
总结
HashMap
是一个灵活、高性能的数据结构,适用于需要通过键值对进行查找、插入和删除操作的场景
三、二者区别
ConcurrentHashMap
和 HashMap
是 Java 中两种不同的 Map 实现,它们在多线程环境下的行为和特性有显著的区别。
线程安全性:
HashMap
不是线程安全的,多个线程同时访问 HashMap
并且至少有一个线程修改了其结构时,需要外部同步控制来确保线程安全。
ConcurrentHashMap
是线程安全的,并发访问不需要额外的同步控制。它使用了分段锁(Segment)或 CAS 操作(从 JDK 8 开始)来支持高并发的读和写操作,不会阻塞整个数据结构,允许多个线程并发地进行读取和部分修改操作。
内部结构:
HashMap
的基本结构是数组 + 链表或红黑树(JDK 8+),哈希冲突时采用链表或树来解决。
ConcurrentHashMap
在 JDK 7 中使用了分段锁的概念,将数据分成多个 Segment,每个 Segment 就是一个小的 HashMap,不同 Segment 的数据修改操作可以并发进行。在 JDK 8 中引入了更加高效的实现,使用了 CAS 操作和更复杂的数据结构来提高并发性能。
迭代时的一致性:
在 HashMap
的迭代过程中,如果有其他线程对其进行了结构性修改(插入、删除等操作),可能会抛出 ConcurrentModificationException
异常。
ConcurrentHashMap
在迭代时可以进行修改,不会抛出 ConcurrentModificationException
异常。它通过一些机制(如迭代器内部的快照)来提供弱一致性的迭代。
初始容量和负载因子的调整:
HashMap
可以通过初始容量和负载因子进行初始化,但在高并发场景下,可能需要手动控制容量和同步访问以确保线程安全。
ConcurrentHashMap
的大小可以动态地增长,并且通常不需要手动调整容量和负载因子。
null 值的处理:
HashMap
允许键和值都为 null。
ConcurrentHashMap
不允许键或值为 null。若放入 null 值会抛出 NullPointerException
。
总结
ConcurrentHashMap
相对于 HashMap
在并发环境下提供了更好的线程安全性和性能。在多线程并发访问的场景中,特别是读写操作频繁的情况下,ConcurrentHashMap
更适合使用。而在单线程环境下或者无并发访问需求的情况下,可以考虑使用普通的 HashMap
。