java多线程(十) 之构建高效且可伸缩的结果缓存

最新推荐文章于 2024-05-16 15:37:55 发布

jrymos001

最新推荐文章于 2024-05-16 15:37:55 发布

阅读量534

点赞数 1

分类专栏： java多线程文章标签： java多线程高效结果缓存可伸缩

本文链接：https://blog.csdn.net/m0_37681914/article/details/72793114

版权

java多线程专栏收录该内容

10 篇文章 0 订阅

订阅专栏

几乎所有的服务器应用程序都会使用某种形式的缓存,重用之前的计算结果能降低延迟,提高吞吐量,但却需要消耗更多的内存.
本节,我们将开发一个高效且可伸缩的缓存,用于改进一个高计算开销的函数.
我们首先从简单的HashMap开始,然后分析它的并发性缺陷,并讨论如何修复它们.

public interface Computable<A, V> {
    V compute(A arg) throws InterruptedException;
}

import java.math.BigInteger;

public class ExpensiveFunction implements Computable<String,BigInteger>{

    @Override
    public BigInteger compute(String arg) throws InterruptedException {
        //假设经过长时间计算arg
        return new BigInteger(arg);
    }

}

一. 使用HashMap和同步机制来初始化缓存

import java.util.HashMap;
import java.util.Map;

public class Memoizer1<A, V> implements Computable<A,V>{

    private final Map<A,V> cache = new HashMap<A,V>();
    private final Computable<A,V> c;

    public Memoizer1(Computable<A,V> c) {
        this.c = c;
    }


    @Override
    public synchronized V compute(A arg) throws InterruptedException {
        V result = cache.get(arg);
        if(result == null){
            result = c.compute(arg);
            cache.put(arg, result);
        }
        return result;
    }

}

这种方法虽然保证了线程的安全性,却带来了一个明显的可伸缩性问题: 每次只有一个线程能够执行compute.

这里写图片描述

从上图可以看出,当A线程计算出f(1)时,C线程还不能直接得到f(1),需要等待B线程,假如很多线程进行compute方法的调用,可能导致后面的线程严重阻塞.

二. 使用ConcurrentHashMap替换HashMap

Memoizer2比Memoizer1有着更好的并发行为,多线程可以并发的使用它.

import java.util.Map;
import java.util.concurrent.ConcurrentHashMap;

public class Memoizer2<A, V> implements Computable<A, V>{
    private final Map<A,V> cache = new ConcurrentHashMap<>();

    private final Computable<A,V> c;

    public Memoizer2(Computable<A,V> c) {
        this.c = c;
    }

    @Override
    public V compute(A arg) throws InterruptedException {
        V result = cache.get(arg);
        if(result == null){
            result = c.compute(arg);
            cache.put(arg, result);
        }
        return result;
    }
}

但是Memoizer2仍然存在一些不足,当两个线程调用compute时,可能会导致重复计算.

这里写图片描述

Memoizer2的主要问题在于,如果f(n)中间的计算开销很大的话,而其他线程并不知道这个计算正在进行,那么很可能会重复这个计算.

三. 基于FutureTask的Memoizing封装器

import java.util.Map;
import java.util.concurrent.Callable;
import java.util.concurrent.ConcurrentHashMap;
import java.util.concurrent.ExecutionException;
import java.util.concurrent.Future;
import java.util.concurrent.FutureTask;

public class Memoizer3<A, V> implements Computable<A, V>{

    private final Map<A,Future<V>> cache = new ConcurrentHashMap<A,Future<V>> ();

    private final Computable<A,V> c;

    public Memoizer3(Computable<A,V> c) {
        this.c = c;
    }

    @Override
    public V compute(A arg) throws InterruptedException {
        Future<V> f = cache.get(arg);
        if(f==null){
            Callable<V> eval = new Callable<V>(){
                @Override
                public V call() throws Exception {
                    return c.compute(arg);
                }
            };
            FutureTask<V> ft = new FutureTask<>(eval);
            f = ft;
            cache.put(arg, ft);
            ft.run();
        }
        try {
            return f.get();
        } catch (ExecutionException e) {
            e.printStackTrace();
        }
        return null;
    }
}

Memoizer3的实现几乎是完美的,它表现了非常好的并发性,若结果已经计算出来了,那么将立即返回.
如果其他线程正在计算该结果,那么新到的线程将一直等待这个结果被计算出来.
它只有一个缺陷,即仍然存在两个线程计算出相同的值的漏洞,这个漏洞的发生概率要远小于Memoizer2.
这个缺陷原因在于,if中的代码块,仍然是非原子的.

四. 将添加计算任务FutureTask原子化

import java.util.Map;
import java.util.concurrent.Callable;
import java.util.concurrent.ConcurrentHashMap;
import java.util.concurrent.ExecutionException;
import java.util.concurrent.Future;
import java.util.concurrent.FutureTask;

public class Memoizer4<A, V> implements Computable<A, V>{

    private final Map<A,Future<V>> cache = new ConcurrentHashMap<A,Future<V>> ();

    private final Computable<A,V> c;

    public Memoizer4(Computable<A,V> c) {
        this.c = c;
    }

    @Override
    public V compute(A arg) throws InterruptedException {
        Future<V> f = cache.get(arg);
        if(f==null){
            Callable<V> eval = new Callable<V>(){
                @Override
                public V call() throws Exception {
                    return c.compute(arg);
                }
            };
            FutureTask<V> ft = new FutureTask<>(eval);
            f = cache.putIfAbsent(arg, ft);
            if(f==null){
                f = ft;
                ft.run();
            }
        }
        try {
            return f.get();
        } catch (ExecutionException e) {
            e.printStackTrace();
        }
        return null;
    }

}

仍然存在的问题:
由于缓存的是Future而不是值,将导致缓存污染.
例如: 当某个future计算失败的时候,Map中依然存储着该future,没有被移除.

最终版本:

        try {
            return f.get();
        } catch (ExecutionException e) {
            cache.remove(arg,f);
        }

jrymos001

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
java多线程(十) 之构建高效且可伸缩的结果缓存

几乎所有的服务器应用程序都会使用某种形式的缓存,重用之前的计算结果能降低延迟,提高吞吐量,但却需要消耗更多的内存. 本节,我们将开发一个高效且可伸缩的缓存,用于改进一个高计算开销的函数. 我们首先从简单的HashMap开始,然后分析它的并发性缺陷,并讨论如何修复它们.public interface Computable<A, V> { V compute(A arg) throws I
复制链接

扫一扫