ConcurrentHashMap 原理与优化

hummhumm

已于 2024-05-21 15:46:30 修改

阅读量284

点赞数 5

文章标签：开发语言运维 java 数据库 java-ee

于 2024-05-18 16:49:11 首次发布

本文链接：https://blog.csdn.net/hummhumm/article/details/139027965

版权

Java并发编程领域，`ConcurrentHashMap`作为线程安全的哈希表实现，以其高效、灵活的特点，在多线程环境下数据存储与访问中扮演着至关重要的角色。本文将深入源码，细致剖析`ConcurrentHashMap`的内部结构、工作原理及优化策略，并结合实例展示其强大功能。

### 一、并发容器的设计哲学

并发容器的设计旨在解决传统集合类在多线程环境下的线程安全问题，同时尽可能减少锁竞争带来的性能损耗。`ConcurrentHashMap`采用了分段锁（Segment）机制，自Java 8起进一步优化为基于CAS（Compare and Swap）操作和节点引用的链表/树形结构，实现了更高的并发度和更低的锁粒度。

### 二、内部结构概览

#### Java 7中的Segment设计

在Java 7中，`ConcurrentHashMap`使用了Segment作为内部锁的单位，每个Segment继承自ReentrantLock，相当于一个可重入锁。整个映射被分割成多个Segment，每个Segment维护着自己的HashEntry数组，这样的设计允许并发地对不同Segment进行读写操作。

#### Java 8的CAS与Node优化

Java 8对`ConcurrentHashMap`进行了重大重构，摒弃了Segment设计，转而采用Node节点（链表/红黑树）与CAS操作相结合的方式。每个Node包含键值对、指向下一个Node的引用以及用于同步控制的两个字段：`lockState`（标记节点状态，如是否迁移、是否为树节点等）和`waiter`（用于等待的线程）。这种设计大大减少了锁的使用，提高了并发性能。

### 三、核心方法解析

#### put()方法

以`put()`方法为例，Java 8版本的实现首先通过CAS操作尝试更新节点，失败则利用synchronized块进行自旋或阻塞，直至成功。当链表长度超过阈值时，会转换为红黑树以提高查找效率。这一系列操作充分展示了`ConcurrentHashMap`如何在保证线程安全的同时，尽量减少同步开销。

#### size()方法

由于并发修改的存在，直接计算大小是一个挑战。Java 7中通过累加各Segment的计数器实现，而Java 8引入了更为精确的计数机制，包括baseCount（基本计数）、sumCount（总和计数）以及cellCount（细粒度计数），通过这些变量的维护和CAS操作来近似实时地统计元素数量。

### 四、实战案例：高效并发计数器

让我们通过一个简单的案例，演示如何利用`ConcurrentHashMap`实现一个高性能的并发计数器。假设我们需要统计网站上不同页面的访问次数，可以这样做：

```java

import java.util.concurrent.ConcurrentHashMap;



public class ConcurrentCounter {

    private ConcurrentHashMap<String, Integer> counter = new ConcurrentHashMap<>();



    public void increment(String pageName) {

        counter.compute(pageName, (key, oldValue) -> oldValue == null ? 1 : oldValue + 1);

    }



    public int getCount(String pageName) {

        return counter.getOrDefault(pageName, 0);

    }

}

```

此例中，`compute()`方法保证了原子性地增加计数，即使在高并发环境下也能确保计数的准确性。

### 五、总结

`ConcurrentHashMap`的演化历程是Java并发编程技术进步的一个缩影，展现了从粗粒度锁向无锁/低锁设计思路的转变。通过对其实现原理的深入理解，我们不仅能更好地掌握其在实际开发中的应用，还能激发对并发设计模式更深层次的思考。无论是处理大数据并发访问，还是构建高性能服务，`ConcurrentHashMap`都是不可或缺的工具之一。未来，随着Java生态的持续发展，期待它能带来更多的惊喜与优化。

### 六、实战案例拓展

#### demo1：任务分配器

在分布式系统中，常常需要将大量任务均匀且高效地分配给不同的处理器（或线程）。我们可以利用`ConcurrentHashMap`来实现一个简易的任务分配器，每个处理器对应一个Key，任务数量作为Value，利用原子操作保证任务的高效分配。```java

import java.util.concurrent.ConcurrentHashMap;
import java.util.concurrent.atomic.AtomicInteger;

public class TaskDistributor {
    private final ConcurrentHashMap<Integer, AtomicInteger> taskCounts = new ConcurrentHashMap<>();

    public void assignTask(int processorId) {
        taskCounts.compute(processorId, (id, count) -> {
            if (count == null) {
                return new AtomicInteger(1);
            } else {
                return new AtomicInteger(count.incrementAndGet());
            }
        });
    }

    public int getTaskCount(int processorId) {
        AtomicInteger count = taskCounts.get(processorId);
        return count != null ? count.get() : 0;
    }
}

```

#### demo2：缓存实现

`ConcurrentHashMap`也可以作为简单但高效的缓存实现，利用其线程安全的特性来存储热点数据。我们可以添加一个定时清理机制，利用弱引用防止内存泄漏，保持内存的有效管理。```java

import java.lang.ref.WeakReference;
import java.util.concurrent.ConcurrentHashMap;
import java.util.concurrent.Executors;
import java.util.concurrent.ScheduledExecutorService;
import java.util.concurrent.TimeUnit;

public class SimpleCache<K, V> {
    private final ConcurrentHashMap<K, WeakReference<V>> cache = new ConcurrentHashMap<>();
    private final ScheduledExecutorService cleaner = Executors.newSingleThreadScheduledExecutor();

    public void put(K key, V value) {
        cache.put(key, new WeakReference<>(value));
    }

    public V get(K key) {
        WeakReference<V> ref = cache.get(key);
        return ref != null ? ref.get() : null;
    }

    // 定时清理过期引用
    public void startCleanupTask(long interval, TimeUnit unit) {
        cleaner.scheduleAtFixedRate(() -> cache.entrySet().removeIf(entry -> entry.getValue().get() == null), 
                                   0, interval, unit);
    }

    // 关闭清理服务，释放资源
    public void shutdown() {
        cleaner.shutdown();
    }
}

```

#### demo3：并发计时器

在性能测试或监控场景中，我们可能需要记录并统计某些操作的执行时间分布。利用`ConcurrentHashMap`可以实现一个并发安全的计时器，记录不同时间范围内的调用次数。```java

import java.util.concurrent.ConcurrentHashMap;
import java.util.concurrent.TimeUnit;

public class ConcurrentTimer {
    private final ConcurrentHashMap<Long, Integer> timeBuckets = new ConcurrentHashMap<>();

    public void recordExecutionTime(long executionTimeMillis) {
        long bucketKey = TimeUnit.MILLISECONDS.toSeconds(executionTimeMillis); // 以秒为单位划分桶
        timeBuckets.compute(bucketKey, (key, count) -> count == null ? 1 : count + 1);
    }

    public int getExecutionCountInRange(long startTimeSec, long endTimeSec) {
        int count = 0;
        for (long key = startTimeSec; key <= endTimeSec; key++) {
            Integer bucketCount = timeBuckets.get(key);
            count += bucketCount != null ? bucketCount : 0;
        }
        return count;
    }
}

```

以上三个实战案例，分别展示了`ConcurrentHashMap`在任务分配、缓存管理和性能监控方面的应用，进一步证明了其在并发编程领域的灵活性与实用性。通过这些实例，我们能够更直观地感受到`ConcurrentHashMap`的强大功能及其在解决实际问题中的价值。

hummhumm

关注

5
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
ConcurrentHashMap 原理与优化

ConcurrentHashMap`的演化历程是Java并发编程技术进步的一个缩影，展现了从粗粒度锁向无锁/低锁设计思路的转变。`ConcurrentHashMap`采用了分段锁（Segment）机制，自Java 8起进一步优化为基于CAS（Compare and Swap）操作和节点引用的链表/树形结构，实现了更高的并发度和更低的锁粒度。Java并发编程领域，`ConcurrentHashMap`作为线程安全的哈希表实现，以其高效、灵活的特点，在多线程环境下数据存储与访问中扮演着至关重要的角色。
复制链接

扫一扫