Java并发编程实战基础构建模块总结

最新推荐文章于 2022-09-17 15:16:21 发布

Living_Z

最新推荐文章于 2022-09-17 15:16:21 发布

阅读量149

点赞数

分类专栏： Java并发文章标签： Java并发

本文链接：https://blog.csdn.net/qq_26814945/article/details/89486423

版权

Java并发专栏收录该内容

14 篇文章 0 订阅

订阅专栏

同步容器类
这些类实现线程安全的方式是：将它们的状态封装起来并对每个公有方法都进行同步使得每次只有一个线程能访问容器的状态

同步容器类的问题
容器上常见的复合操作包括：迭代(反复访问元素直到遍历完容器中所有元素) 跳转(根据指定顺序找到当前元素的下一个元素)以及条件运算例如若没有则添加(检查在Map中是否存在键值K 如果没有就加入二元组(K V)) 在同步容器中这些复合操作在没有客户端加锁的情况下仍然是线程安全的但当其他线程并发地修改容器时它们可能会表现出意料之外的行为

Vector上可能导致混乱结果的复合操作

public class UnsafeVectorHelpers {
    public static Object getLast(Vector list) {
        int lastIndex = list.size() - 1;
        return list.get(lastIndex);
    }

    public static void deleteLast(Vector list) {
        int lastIndex = list.size() - 1;
        list.remove(lastIndex);
    }
}

由于同步容器类要遵守同步策略即支持客户端加锁因此可能会创建一些新的操作只要我们知道应该使用哪一个锁那么这些新操作就与容器的其他操作一样都是原子操作同步容器类通过其自身的锁来保护它的每个方法

在使用客户端加锁的Vector上的复合操作

public class SafeVectorHelpers {
    public static Object getLast(Vector list) {
        synchronized (list) {
            int lastIndex = list.size() - 1;
            return list.get(lastIndex);
        }
    }

    public static void deleteLast(Vector list) {
        synchronized (list) {
            int lastIndex = list.size() - 1;
            list.remove(lastIndex);
        }
    }
}

在调用size和相应的get之间 Vector的长度可能会发生变化这种风险在对Vector中的元素进行迭代时仍然会出现

可能抛出ArrayIndexOutOfBoundsException的迭代操作

for (int i = 0; i < vector.size(); i++)
	doSomething(vector.get(i));

这种迭代操作的正确性要依赖于运气即在调用size和get之间没有线程会修改Vector
我们可以通过在客户端加锁来解决不可靠迭代的问题但要牺牲一些伸缩性通过在迭代期间持有Vector的锁可以防止其他线程在迭代期间修改Vector 然而这同样会导致其他线程在迭代期间无法访问它因此降低了并发性

带有客户端加锁的迭代

synchronized (vector) {
	for (int i = 0; i < vector.size(); i++)
		doSomething(vector.get(i));
}

迭代器与ConcurrentModificationException
当迭代器发现容器在迭代过程中被修改时就会抛出一个ConcurrentModificationException异常并且它们表现出的行为是及时失败(fail-fast)的
它们采用的实现方式是将计数器的变化与容器关联起来：如果在迭代期间计数器被修改那么hasNext或next将抛出ConcurrentModificationException 然而这种检查是在没有同步的情况下进行的因此可能会看到失效的计数值而迭代器可能并没有意识到已经发生了修改这是一种设计上的权衡从而降低并发修改操作的检测代码对程序性能带来的影响在单线程代码中也可能抛出ConcurrentModificationException异常当对象直接从容器中删除而不是通过Iterator.remove来删除时就会抛出这个异常

通过Iterator来迭代List

List<Widget> widgetList = Collections.synchronizedList(new ArrayList<Widget>());
...
//可能抛出ConcurrentModificationException
for (Widget w : widgetList )
 doSomething(w);

与迭代Vector一样要想避免出现ConcurrentModificationException 就必须在迭代过程持有容器的锁
然而有时候开发人员并不希望在迭代期间对容器加锁例如某些线程在可以访问容器之前必须等待迭代过程结束如果容器的规模很大或者在每个元素上执行操作的时间很长那么这些线程将长时间等待
如果不希望在迭代期间对容器加锁那么一种替代方法就是克隆容器并在副本上进行迭代由于副本被封闭在线程内因此其他线程不会在迭代期间对其进行修改这样就避免了抛出ConcurrentModificationException(在克隆过程中仍然需要对容器加锁) 在克隆容器时存在显著的性能开销这种方式的好坏取决于多个因素包括容器的大小在每个元素上执行的工作迭代操作相对于容器其他操作的调用频率以及在相应时间和吞吐量等方面的需求

隐藏迭代器
虽然加锁可以防止迭代器抛出ConcurrentModificationException 但你必须要记住在所有对共享容器进行迭代的地方都需要加锁实际情况要更加复杂因为在某些情况下迭代器会隐藏起来

隐藏在字符串连接中的迭代操作(不要这么做)

public class HiddenIterator {
    @GuardedBy("this") private final Set<Integer> set = new HashSet<Integer>();

    public synchronized void add(Integer i) {
        set.add(i);
    }

    public synchronized void remove(Integer i) {
        set.remove(i);
    }

    public void addTenThings() {
        Random r = new Random();
        for (int i = 0; i < 10; i++)
            add(r.nextInt());
        System.out.println("DEBUG: added ten elements to " + set);//此处迭代
    }
}

addTenThings方法可能会抛出ConcurrentModificationException 因为在生成调试消息的过程中 toString对容器进行迭代
如果HiddenIterator用synchronizedSet来包装HashSet 并且对同步代码进行封装那么就不会发生这种错误

正如封装对象的状态有助于维持不变性条件一样封装对象的同步机制同样有助于确保实施同步策略

容器的hashCode和equals等方法也会间接地执行迭代操作当容器作为另一个容器的元素或键值时就会出现这种情况同样 containsAll removeAll和retainAll等方法以及把容器作为参数的构造函数都会对容器进行迭代所有这些间接的迭代操作都可能抛出ConcurrentModificationException

并发容器
通过并发容器来代替同步容器可以极大地提高伸缩性并降低风险

ConcurrentHashMap
同步容器类在执行每个操作期间都持有一个锁
与HashMap一样 ConcurrentHashMap也是一个基于散列的Map 但它使用了一种完全不同的加锁策略来提供更高的并发性和伸缩性 ConcurrentHashMap并不是将每个方法都在同一个锁上同步并使得每次只能有一个线程访问容器而是使用一种粒度更细的加锁机制来实现更大程度的共享这种机制称为分段锁(Lock Striping) 在这种机制中任意数量的读取线程可以并发地访问Map 执行读取操作的线程和执行写入操作的线程可以并发地访问Map 并且一定数量的写入线程可以并发地修改Map ConcurrentHashMap带来的结果是在并发访问环境下将实现更高的吞吐量而在单线程环境中只损失非常小的性能

ConcurrentHashMap与其他并发容器一起增强了同步容器类：它们提供的迭代器不会抛出ConcurrentModificationException 因此不需要在迭代过程中对容器加锁 ConcurrentHashMap返回的迭代器具有弱一致性(Weakly Consistent) 而并非及时失败弱一致性的迭代器可以容忍并发的修改当创建迭代器时会遍历已有的元素并可以(但是不保证)在迭代器被构造后将修改操作反应给容器

与HashMap和synchronizedMap相比 ConcurrentHashMap有着更多的优势以及更少的劣势因此在大多数情况下用ConcurrentHashMap来代替同步Map能进一步提高代码的可伸缩性只有当应用程序需要加锁Map以进行独占访问时才应该放弃使用ConcurrentHashMap

额外的原子Map操作
由于ConcurrentHashMap不能被加锁来执行独占访问因此我们无法使用客户端加锁来创建新的原子操作但是一些常见的复合操作例如若没有则添加若相等则移除(Remove-If-Equal) 和若相等则替换(Replace-If-Equal) 等都已经实现为原子操作并且在ConcurrentMap的接口中声明如果你需要在现有的同步Map中添加这样的功能那么很可能就意味着应该考虑使用ConcurrentMap了

CopyOnWriteArrayList
CopyOnWriteArrayList用于替代同步List 在某些情况下它提供了更好的并发性能并且在迭代期间不需要对容器进行加锁或复制(类似地 CopyOnWriteArraySet的作用是替代同步Set)

写入时复制(Copy-On-Write) 容器的线程安全性在于只要正确地发布一个事实不可变的对象那么在访问该对象时就不再需要进一步的同步在每次修改时都会创建并重新发布一个新的容器副本从而实现可变性写入时复制容器的迭代器保留一个指向底层基础数组的引用这个数组当前位于迭代器的起始位置由于它不会被修改因此在对其进行同步时只需确保数组内容的可见性因此多个线程可以同时对这个容器进行迭代而不会彼此干扰或者与修改容器的线程相互干扰写入时复制容器返回的迭代器不会抛出ConcurrentModificationException 并且返回的元素与迭代器创建时的元素完全一致而不必考虑之后修改操作所带来的影响

显然每当修改容器时都会复制底层数组这需要一定的开销特别是当容器的规模较大时仅当迭代操作远远多于修改操作时才应该使用写入时复制容器这个准则很好地描述了许多事件通知系统：在分发通知时需要迭代已注册监听器链表并调用每一个监听器在大多数情况下注册和注销事件监听器的操作远少于接收事件通知的操作

阻塞队列和生产者-消费者模式
阻塞队列支持生产者-消费者这种设计模式该模式将找出需要完成的工作与执行工作这两个过程分离开来并把工作项放入一个待完成列表中以便在随后处理而不是找出后立即处理生产者-消费者模式能简化开发过程因为它消除了生产者类和消费者类之间的代码依赖性此外该模式还将生产数据的过程与使用数据的过程解耦开来以简化工作负载的管理因为这两个过程在处理数据的速率上有所不同

在基于阻塞队列构建的生产者-消费者设计中当数据生成时生产者把数据放入队列而当消费者准备处理数据时将从队列中获取数据生产者不需要知道消费者的标识或数量或者它们是否是唯一的生产者而只需将数据放入队列即可同样消费者也不需要知道生产者是谁或者工作来自何处 BlockingQueue简化了生产者-消费者设计的实现过程它支持任意数量的生产者和消费者一种最常见的生产者-消费者设计模式就是线程池与工作队列的组合在Executor任务执行框架中就体现了这种模式

在构建高可靠的应用程序时有界队列是一种强大的资源管理工具：它们能抑制并防止产生过多的工作项使应用程序在负荷过载的情况下变得更加健壮

示例：桌面搜索
有一种类型的程序适合被分解为生产者和消费者例如代理程序它将扫描本地驱动器上的文件并建立索引以便随后进行搜索类似于某些桌面搜索程序或者Windows索引服务

桌面搜索应用程序中的生产者任务和消费者任务

public class ProducerConsumer {
    static class FileCrawler implements Runnable {
        private final BlockingQueue<File> fileQueue;
        private final FileFilter fileFilter;
        private final File root;

        public FileCrawler(BlockingQueue<File> fileQueue,
                           final FileFilter fileFilter,
                           File root) {
            this.fileQueue = fileQueue;
            this.root = root;
            this.fileFilter = new FileFilter() {
                public boolean accept(File f) {
                    return f.isDirectory() || fileFilter.accept(f);
                }
            };
        }

        private boolean alreadyIndexed(File f) {
            return false;
        }

        public void run() {
            try {
                crawl(root);
            } catch (InterruptedException e) {
                Thread.currentThread().interrupt();
            }
        }

        private void crawl(File root) throws InterruptedException {
            File[] entries = root.listFiles(fileFilter);
            if (entries != null) {
                for (File entry : entries)
                    if (entry.isDirectory())
                        crawl(entry);
                    else if (!alreadyIndexed(entry))
                        fileQueue.put(entry);
            }
        }
    }

    static class Indexer implements Runnable {
        private final BlockingQueue<File> queue;

        public Indexer(BlockingQueue<File> queue) {
            this.queue = queue;
        }

        public void run() {
            try {
                while (true)
                    indexFile(queue.take());
            } catch (InterruptedException e) {
                Thread.currentThread().interrupt();
            }
        }

        public void indexFile(File file) {
            // Index the file...
        };
    }
}

生产者-消费者模式提供了一种适合线程的方法将桌面搜索问题分解为更简单的组件将文件遍历与建立索引等功能分解为独立的操作比将所有功能都放到一个操作中实现有着更高的代码可读性和可重用性：每个操作只需完成一个任务并且阻塞队列将负责所有的控制流因此每个功能的代码都更加简单和清晰生产者-消费者模式同样能带来许多性能优势

启动桌面搜索

	private static final int BOUND = 10;
    private static final int N_CONSUMERS = Runtime.getRuntime().availableProcessors();

    public static void startIndexing(File[] roots) {
        BlockingQueue<File> queue = new LinkedBlockingQueue<File>(BOUND);
        FileFilter filter = new FileFilter() {
            public boolean accept(File file) {
                return true;
            }
        };

        for (File root : roots)
            new Thread(new FileCrawler(queue, filter, root)).start();

        for (int i = 0; i < N_CONSUMERS; i++)
            new Thread(new Indexer(queue)).start();
    }

串行线程封闭
在java.util.concurrent中实现的各种阻塞队列都包含了足够的内部同步机制从而安全地将对象从生产者线程发布到消费者线程
对于可变对象生产者-消费者这种设计与阻塞队列一起促进了串行线程封闭从而将对象所有权从生产者交付给消费者线程封闭对象只能由单个线程拥有但可以通过安全地发布该对象来转移所有权在转移所有权后也只有另一个线程能获得这个对象的访问权限并且发布对象的线程不会再访问它

双端队列与工作密取
正如阻塞队列适用于生产者-消费者模式双端队列同样适用于另一种相关模式即工作密取(Work Stealing) 在生产者-消费者设计中所有消费者有一个共享的工作队列而在工作密取设计中每个消费者都有各自的双端队列如果一个消费者完成了自己双端队列中的全部工作那么它可以从其他消费者双端队列末尾秘密地获取工作密取工作模式比传统的生产者-消费者模式具有更高的可伸缩性这是因为工作者线程不会在单个共享的任务队列上发生竞争在大多数时候它们都只是访问自己的双端队列从而极大地减少了竞争当工作者线程需要访问另一个队列时它会从队列的尾部而不是从头部获取工作因此进一步降低了队列上的竞争程度

阻塞方法与中断方法
线程可能会则塞或暂停执行原因有多种：等待I/O操作结束等待获得一个锁等待从Thread.sleep方法中醒来或是等待另一个线程的计算结果
Thread提供了interrupt方法用于中断线程或者查询线程是否已经被中断每个线程都有一个布尔类型的属性表示线程的中断状态当中断线程时将设置这个状态
中断是一种协作机制一个线程不能强制其他线程停止正在执行的操作而去执行其他的操作
当在代码中调用了一个将抛出InterruptedException异常的方法时你自己的方法也就变成了一个阻塞方法并且必须要处理对中断的响应对于库代码来说有两种基本选择：
传递InterruptedException 避开这个异常通常是最明智的策略-只需把InterruptedException传递给方法的调用者传递InterruptedException的方法包括根本不捕获该异常或者捕获该异常然后在执行某种简单的清理工作后再次抛出这个异常
恢复中断有时候不能抛出InterruptedException 例如当代码是Runnable的一部分时在这些情况下必须捕获InterruptedException 并通过调用当前线程上的interrupt方法恢复中断状态这样在调用栈中更高层的代码将看到引发了一个中断

恢复中断状态以避免屏蔽中断

public class TaskRunnable implements Runnable {
    BlockingQueue<Task> queue;

    public void run() {
        try {
            processTask(queue.take());
        } catch (InterruptedException e) {
            // restore interrupted status
            Thread.currentThread().interrupt();
        }
    }

    void processTask(Task task) {
        // Handle the task
    }

    interface Task {
    }
}

同步工具类
同步工具类可以是任何一个对象只要它根据其自身的状态来协调线程的控制流阻塞队列可以作为同步工具类其他类型的同步工具类还包括信号量(Semaphore) 栅栏(Barrier)以及闭锁(Latch)
所有的同步工具类都包含一些特定的结构化属性：它们封装了一些状态这些状态将决定执行同步工具类的线程是继续执行还是等待此外还提供了一些方法对状态进行操作以及另一些方法用于高效地等待同步工具类进入到预期状态

闭锁
闭锁是一种同步工具类可以延迟线程的进度直到其到达终止状态闭锁的作用相当于一扇门：在闭锁到达结束状态之前这扇门一直是关闭的并且没有任何线程能通过当到达结束状态时这扇门会打开并允许所有的线程通过当闭锁到达结束状态后将不会再改变状态因此这扇门将永远保持打开状态闭锁可以用来确保某些活动直到其他活动都完成后才继续执行

在计时测试中使用CountDownLatch来启动和停止线程

public class TestHarness {
    public long timeTasks(int nThreads, final Runnable task)
            throws InterruptedException {
        final CountDownLatch startGate = new CountDownLatch(1);
        final CountDownLatch endGate = new CountDownLatch(nThreads);

        for (int i = 0; i < nThreads; i++) {
            Thread t = new Thread() {
                public void run() {
                    try {
                        startGate.await();
                        try {
                            task.run();
                        } finally {
                            endGate.countDown();
                        }
                    } catch (InterruptedException ignored) {
                    }
                }
            };
            t.start();
        }

        long start = System.nanoTime();
        startGate.countDown();
        endGate.await();
        long end = System.nanoTime();
        return end - start;
    }
}

为什么要在TestHarness中使用闭锁而不是在线程创建后就立即启动？或许我们希望测试n个线程并发执行某个任务时需要的时间如果在创建线程后立即启动它们那么先启动的线程将领先后启动的线程并且活跃线程数量会随着时间的推移而增加或减少竞争程度也在不断发生变化启动门将使得主线程能够同时释放所有工作线程而结束门则使主线程能够等待最后一个线程执行完成而不是顺序地等待每个线程执行完成

FutureTask
FutureTask也可以用做闭锁(FutureTask实现了Future语义表示一种抽象的可生成结果的结算) FutureTask表示的计算是通过Callable来实现的相当于一种可生成结果的Runnable 并且可以处于以下3种状态：等待运行(Waiting to run) 正在运行(Running)和运行完成(Completed) 执行完成表示计算的所有可能结束方式包括正常结束由于取消而结束和由于异常而结束等当FutureTask进入完成状态后它会永远停止在这个状态上
Future.get的行为取决于任务的状态如果任务已经完成那么get会立即返回结果否则get将阻塞直到任务进入完成状态然后返回结果或者抛出异常 FutureTask将计算结果从执行计算的线程传递到获取这个结果的线程而FutureTask的规范确保了这种传递过程能实现结果的安全发布
FutureTask在Executor框架中表示异步任务此外还可以用来表示一些时间较长的计算这些计算可以在使用计算结果之前启动

使用FutureTask来提前加载稍后需要的数据

public class Preloader {
    ProductInfo loadProductInfo() throws DataLoadException {
        return null;
    }

    private final FutureTask<ProductInfo> future =
        new FutureTask<ProductInfo>(new Callable<ProductInfo>() {
            public ProductInfo call() throws DataLoadException {
                return loadProductInfo();
            }
        });
    private final Thread thread = new Thread(future);

    public void start() { thread.start(); }

    public ProductInfo get()
            throws DataLoadException, InterruptedException {
        try {
            return future.get();
        } catch (ExecutionException e) {
            Throwable cause = e.getCause();
            if (cause instanceof DataLoadException)
                throw (DataLoadException) cause;
            else
                throw LaunderThrowable.launderThrowable(cause);
        }
    }

    interface ProductInfo {
    }
}

class DataLoadException extends Exception { }

Preloader创建了一个FutureTask 其中包含从数据库加载产品信息的任务以及一个执行运算的线程由于在构造函数或静态初始化方法中启动线程并不是一种好方法因此提供了一个start方法来启动线程当程序随后需要ProductInfo时可以调用get方法如果数据已经加载那么将返回这些数据否则将等待加载完成后再返回

强制将未检查的Throwable转换为RuntimeException

public class LaunderThrowable {

    /**
     * Coerce an unchecked Throwable to a RuntimeException
     * <p/>
     * If the Throwable is an Error, throw it; if it is a
     * RuntimeException return it, otherwise throw IllegalStateException
     */
    public static RuntimeException launderThrowable(Throwable t) {
        if (t instanceof RuntimeException)
            return (RuntimeException) t;
        else if (t instanceof Error)
            throw (Error) t;
        else
            throw new IllegalStateException("Not unchecked", t);
    }
}

信号量
计数信号量(Counting Semaphore)用来控制同时访问某个特定资源的操作数量或者同时执行某个指定操作的数量计数信号量还可以用来实现某种资源池或者对容器施加边界

Semaphore中管理着一组虚拟的许可(permit) 许可的初始数量可通过构造函数来指定在执行操作时可以首先获得许可(只要还有剩余的许可) 并在使用以后释放许可如果没有许可那么acquire将阻塞直到有许可(或者直到被中断或者操作超时) release方法将返回一个许可给信号量计算信号量的一种简化形式是二值信号量即初始值为1的Semaphore 二值信号量可以用做互斥体(mutex) 并具备不可重入的加锁语义：谁拥有这个唯一的许可谁就拥有了互斥锁

使用Semaphore为容器设置边界

public class BoundedHashSet <T> {
    private final Set<T> set;
    private final Semaphore sem;

    public BoundedHashSet(int bound) {
        this.set = Collections.synchronizedSet(new HashSet<T>());
        sem = new Semaphore(bound);
    }

    public boolean add(T o) throws InterruptedException {
        sem.acquire();
        boolean wasAdded = false;
        try {
            wasAdded = set.add(o);
            return wasAdded;
        } finally {
            if (!wasAdded)
                sem.release();
        }
    }

    public boolean remove(Object o) {
        boolean wasRemoved = set.remove(o);
        if (wasRemoved)
            sem.release();
        return wasRemoved;
    }
}

栅栏
栅栏(Barrier)类似于闭锁它能阻塞一组线程直到某个事件发生栅栏与闭锁的关键区别在于所有线程必须同时到达栅栏位置才能继续执行闭锁用于等待事件而栅栏用于等待其他线程栅栏用于实现一些协议

CyclicBarrier可以使一定数量的参与方反复地在栅栏位置汇集它在并行迭代算法中非常有用：这种算法通常将一个问题拆分成一系列相互独立的子问题当线程到达栅栏位置时将调用await方法这个方法将阻塞直到所有线程都到达栅栏位置如果所有线程都到达了栅栏位置那么栅栏将打开此时所有线程都被释放而栅栏将被重置以便下次使用如果对await的调用超时或者await阻塞的线程被中断那么栅栏就被认为是打破了所有阻塞的await调用都将终止并抛出BrokenBarrierException 如果成功地通过栅栏那么await将为每个线程返回一个唯一的到达索引号我们可以利用这些索引来选举产生一个领导线程并在下一次迭代中由该领导线程执行一些特殊的工作 CyclicBarrier还可以使你将一个栅栏操作传递给构造函数这是一个Runnable 当成功通过栅栏时会(在一个子任务线程中)执行它但在阻塞线程被释放之前是不能执行的

通过CyclicBarrier协调细胞自动衍生系统汇中的计算

public class CellularAutomata {
    private final Board mainBoard;
    private final CyclicBarrier barrier;
    private final Worker[] workers;

    public CellularAutomata(Board board) {
        this.mainBoard = board;
        int count = Runtime.getRuntime().availableProcessors();
        this.barrier = new CyclicBarrier(count,
                new Runnable() {
                    public void run() {
                        mainBoard.commitNewValues();
                    }});
        this.workers = new Worker[count];
        for (int i = 0; i < count; i++)
            workers[i] = new Worker(mainBoard.getSubBoard(count, i));
    }

    private class Worker implements Runnable {
        private final Board board;

        public Worker(Board board) { this.board = board; }
        public void run() {
            while (!board.hasConverged()) {
                for (int x = 0; x < board.getMaxX(); x++)
                    for (int y = 0; y < board.getMaxY(); y++)
                        board.setNewValue(x, y, computeValue(x, y));
                try {
                    barrier.await();
                } catch (InterruptedException ex) {
                    return;
                } catch (BrokenBarrierException ex) {
                    return;
                }
            }
        }

        private int computeValue(int x, int y) {
            // Compute the new value that goes in (x,y)
            return 0;
        }
    }

    public void start() {
        for (int i = 0; i < workers.length; i++)
            new Thread(workers[i]).start();
        mainBoard.waitForConvergence();
    }

    interface Board {
        int getMaxX();
        int getMaxY();
        int getValue(int x, int y);
        int setNewValue(int x, int y, int value);
        void commitNewValues();
        boolean hasConverged();
        void waitForConvergence();
        Board getSubBoard(int numPartitions, int index);
    }
}

另一种形式的栅栏是Exchanger 它是一种两方(Two-Party)栅栏各方在栅栏位置上交换数据当两方执行不对称的操作时 Exchanger会非常有用例如当一个线程向缓冲区写入数据而另一个线程从缓冲区中读取数据这些线程可以使用Exchanger来汇合并将满的缓冲区与空的缓冲区交换当两个线程通过Exchanger交换对象时这种交换就把这两个对象安全地发布给另一方
数据交换的时机取决于应用程序的响应需求最简单的方案是当缓冲区被填满时由填充任务进行交换当缓冲区为空时由情况任务进行交换这样会把需要交换的次数降至最低但如果新数据的到达率不可预测那么一些数据的处理过程就将延迟另一个方法是不仅当缓冲被填满时进行交换并且当缓冲被填充到一定程序并保持一定时间后也进行交换

构建高效且可伸缩的结果缓存
几乎所有的服务器应用程序都会使用某种形式的缓存重用之前的计算结果能降低延迟提高吞吐量但却需要消耗更多的内存

像许多重复发明的轮子一样缓存看上去都非常简单然而简单的缓存可能会将性能瓶颈转变成可伸缩性瓶颈即使缓存是用于提升单线程的性能

使用HashMap和同步机制来初始化缓存

public class Memoizer1 <A, V> implements Computable<A, V> {
    @GuardedBy("this") private final Map<A, V> cache = new HashMap<A, V>();
    private final Computable<A, V> c;

    public Memoizer1(Computable<A, V> c) {
        this.c = c;
    }

    public synchronized V compute(A arg) throws InterruptedException {
        V result = cache.get(arg);
        if (result == null) {
            result = c.compute(arg);
            cache.put(arg, result);
        }
        return result;
    }
}


interface Computable <A, V> {
    V compute(A arg) throws InterruptedException;
}

class ExpensiveFunction
        implements Computable<String, BigInteger> {
    public BigInteger compute(String arg) {
        // after deep thought...
        return new BigInteger(arg);
    }
}

HashMap不是线程安全的因此要确保两个线程不会同时访问HashMap Memoizer1采用了一种保守的方法即对整个compute方法进行同步这种方法能确保线程安全性但会带来一个明显的可伸缩性问题：每次只有一个线程能够执行compute 如果另一个线程正在计算结果那么其他调用compute的线程可能被阻塞很长时间如果有多个线程在排队等待还未计算出的结果那么compute方法的计算时间可能比没有记忆操作的计算时间更长

用ConcurrentHashMap替换HashMap

public class Memoizer2 <A, V> implements Computable<A, V> {
    private final Map<A, V> cache = new ConcurrentHashMap<A, V>();
    private final Computable<A, V> c;

    public Memoizer2(Computable<A, V> c) {
        this.c = c;
    }

    public V compute(A arg) throws InterruptedException {
        V result = cache.get(arg);
        if (result == null) {
            result = c.compute(arg);
            cache.put(arg, result);
        }
        return result;
    }
}

Memoizer2比Memoizer1有着更好的并发行为：多线程可以并发地使用它但它在作为缓存时仍然存在一些不足当两个线程同时调用compute时存在一个漏洞可能会导致计算得到相同的值在使用memoization的情况下这只会带来低效因为缓存的作用是避免相同的数据被计算多次但对于更通用的缓存机制来说这种情况将更为糟糕对于只提供单词初始化的对象缓存来说这个漏洞就会带来安全风险

基于FutureTask的Memoizing封装器

public class Memoizer3 <A, V> implements Computable<A, V> {
    private final ConcurrentMap<A, Future<V>> cache
            = new ConcurrentHashMap<A, Future<V>>();
    private final Computable<A, V> c;

    public Memoizer3(Computable<A, V> c) {
        this.c = c;
    }

    public V compute(final A arg) throws InterruptedException {
            Future<V> f = cache.get(arg);
            if (f == null) {
                Callable<V> eval = new Callable<V>() {
                    public V call() throws InterruptedException {
                        return c.compute(arg);
                    }
                };
                FutureTask<V> ft = new FutureTask<V>(eval);
                    f = ft;
                    cache.put(arg, ft);
                    ft.run(); //在这里将调用c.compute
            }
            try {
                return f.get();
            } catch (CancellationException e) {
                cache.remove(arg, f);
            } catch (ExecutionException e) {
                throw LaunderThrowable.launderThrowable(e.getCause());
            }
    }
}

Memoizer3的实现几乎是完美的：它表现出了非常好的并发性(基本上是源于ConcurrentHashMap高效的并发性) 若结果已经计算出来那么将立即返回如果其他线程正在计算该结果那么新到的线程将一直等待这个结果被计算出来它只有一个缺陷即仍然存在两个线程计算出相同值的漏洞这个漏洞的发生概率要远小于Memoizer2中发生的概率但由于compute方法中的if代码块仍然是非原子(nonatomic)的先检查再执行操作因此两个线程仍有可能在同一时间内调用compute来计算相同的值即二者都没有在缓存中找到期望的值因此都开始计算

Memoizer的最终实现

public class Memoizer <A, V> implements Computable<A, V> {
    private final ConcurrentMap<A, Future<V>> cache
            = new ConcurrentHashMap<A, Future<V>>();
    private final Computable<A, V> c;

    public Memoizer(Computable<A, V> c) {
        this.c = c;
    }

    public V compute(final A arg) throws InterruptedException {
        while (true) {
            Future<V> f = cache.get(arg);
            if (f == null) {
                Callable<V> eval = new Callable<V>() {
                    public V call() throws InterruptedException {
                        return c.compute(arg);
                    }
                };
                FutureTask<V> ft = new FutureTask<V>(eval);
                f = cache.putIfAbsent(arg, ft);
                if (f == null) {
                    f = ft;
                    ft.run();
                }
            }
            try {
                return f.get();
            } catch (CancellationException e) {
                cache.remove(arg, f);
            } catch (ExecutionException e) {
                throw LaunderThrowable.launderThrowable(e.getCause());
            }
        }
    }
}

当缓存的是Future而不是值时将导致缓存污染(Cache Pollution)问题：如果某个计算被取消或者失败那么在计算这个结果时将指明计算过程被取消或者失败为了避免这种情况如果Memoizer发现计算被取消那么将把Future从缓存中移除如果检测到RuntimeException 那么也会移除Future 这样将来的计算才可能成功 Memoizer同样没有解决缓存逾期的问题但它可以通过使用FutureTask的子类来解决在子类中为每个结果指定一个逾期时间并定期扫描缓存中逾期的元素 (同样它也没有解决缓存清理的问题即移除旧的计算结果以便为新的计算结果腾出空间从而使缓存不会消耗过多的内存)

在因式分解servlet中使用Memoizer来缓存结果

@ThreadSafe
public class Factorizer extends GenericServlet implements Servlet {
    private final Computable<BigInteger, BigInteger[]> c =
            new Computable<BigInteger, BigInteger[]>() {
                public BigInteger[] compute(BigInteger arg) {
                    return factor(arg);
                }
            };
    private final Computable<BigInteger, BigInteger[]> cache
            = new Memoizer<BigInteger, BigInteger[]>(c);

    public void service(ServletRequest req,
                        ServletResponse resp) {
        try {
            BigInteger i = extractFromRequest(req);
            encodeIntoResponse(resp, cache.compute(i));
        } catch (InterruptedException e) {
            encodeError(resp, "factorization interrupted");
        }
    }

    void encodeIntoResponse(ServletResponse resp, BigInteger[] factors) {
    }

    void encodeError(ServletResponse resp, String errorString) {
    }

    BigInteger extractFromRequest(ServletRequest req) {
        return new BigInteger("7");
    }

    BigInteger[] factor(BigInteger i) {
        // Doesn't really factor
        return new BigInteger[]{i};
    }
}

第一部分小结

可变状态是至关重要的(It’s the mutable state stupid)
所有的并发问题都可以归结为如何协调对并发状态的访问可变状态越少就越容易确保线程安全性
尽量将域声明为final类型除非需要它们是可变的
不可变对象一定是线程安全的
不可变对象能极大地降低并发编程的复杂性它们更为简单而且安全可以任意共享而无须使用加锁或保护性复制等机制
封装有助于管理复杂性
在编写线程安全的程序时虽然可以将所有数据都保存在全局变量中但为什么要这样做将数据封装在对象中更易于维持不变性条件：将同步机制封装在对象中更易于遵循同步策略
用锁来保护每个可变变量
当保护同一个不变性条件中的所有变量时要使用同一个锁
在执行复合操作期间要持有锁
如果从多个线程中访问同一个可变变量时没有同步机制那么程序会出现问题
不要故作聪明地推断出不需要使用同步
在设计过程中考虑线程安全或者在文档中明确地指出它不是线程安全的
将同步策略文档化

Living_Z

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Java并发编程实战基础构建模块总结

同步容器类这些类实现线程安全的方式是：将它们的状态封装起来并对每个公有方法都进行同步使得每次只有一个线程能访问容器的状态同步容器类的问题容器上常见的复合操作包括：迭代(反复访问元素直到遍历完容器中所有元素) 跳转(根据指定顺序找到当前元素的下一个元素)以及条件运算例如若没有则添加(检查在Map中是否存在键值K 如果没有就加入二元组(K V)) 在同步容器中这些复合操作在没有客户...
复制链接

扫一扫