在 Java 多线程环境中,HashMap
被认为是线程不安全的。这个问题在 JDK 1.7 及之前版本尤为严重,尤其是在扩容时可能导致死循环和数据丢失的问题。尽管 JDK 1.8 对 HashMap
进行了改进,但线程不安全的问题依然存在。
JDK 1.7 中的线程安全问题
在 JDK 1.7 中,HashMap
使用数组加链表的方式来存储键值对。在多线程环境下,扩容时会出现数据丢失和死循环的问题。
死循环问题
在 HashMap
扩容时,如果两个线程同时对 HashMap
进行操作,可能会导致链表形成环,从而引发死循环。以下是简化的扩容代码:
java
void transfer(Entry[] newTable) {
Entry[] src = table;
int newCapacity = newTable.length;
for (int j = 0; j < src.length; j++) {
Entry<K, V> e = src[j];
if (e != null) {
src[j] = null;
do {
Entry<K, V> next = e.next;
int i = indexFor(e.hash, newCapacity);
e.next = newTable[i];
newTable[i] = e;
e = next;
} while (e != null);
}
}
}
如果两个线程同时执行上述代码,可能导致链表结构形成环,从而导致在访问 HashMap
时进入死循环。
JDK 1.8 中的线程安全问题
在 JDK 1.8 中,HashMap
引入了红黑树来优化链表过长的问题,但并没有完全解决线程不安全的问题。
数据覆盖问题
多个线程同时进行 put
操作时,可能会导致数据覆盖。以下是 put
操作的简化代码:
java
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) {
Node<K, V>[] tab;
Node<K, V> p;
int n, i;
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
else {
Node<K, V> e;
K k;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
else if (p instanceof TreeNode)
e = ((TreeNode<K, V>)p).putTreeVal(this, tab, hash, key, value);
else {
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
在多线程环境下,两个线程可能同时检查并插入数据,导致一个线程的数据被另一个线程覆盖。
size
不一致问题
HashMap
的 size
字段用于记录当前存储的键值对数量。在多线程环境下,多个线程同时操作 put
方法可能导致 size
值不一致。
java
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) {
Node<K, V>[] tab;
Node<K, V> p;
int n, i;
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
else {
// Similar logic as above
}
++modCount;
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
在多线程环境下,两个线程同时增加 size
的值,可能导致 size
的值不正确,进而引发数据覆盖的问题。
解决方案
为了避免 HashMap
的线程不安全问题,可以使用以下几种方法:
-
Collections.synchronizedMap
:将HashMap
包装成线程安全的Map
。java
Map<K, V> synchronizedMap = Collections.synchronizedMap(new HashMap<>());
-
ConcurrentHashMap
:JDK 提供的线程安全的HashMap
实现。java
ConcurrentHashMap<K, V> concurrentMap = new ConcurrentHashMap<>();
-
手动加锁:在使用
HashMap
的地方手动加锁。java
synchronized (hashMap) { // 操作 HashMap }
总结
HashMap
在多线程环境下是线程不安全的,主要原因是在并发情况下,多个线程同时操作 HashMap
会导致数据丢失、数据覆盖和死循环等问题。推荐使用 ConcurrentHashMap
或 Collections.synchronizedMap
等线程安全的集合类来避免这些问题。