前言:
并发编程的目的是为了让程序运行得更快,但是,并不是启动更多的线程就能让程序最大限度地并发执行。在进行并发编程时,如果希望通过多线程执行任务让程序运行得更快,会面临非常多的挑战,比如上下文切换的问题、死锁的问题,以及受限于硬件和软件的资源限制问题,本章会介绍几种并发编程的挑战以及解决方案。
一、上下文切换
即使是单核处理器也支持多线程执行代码,CPU 通过给每个线程分配 CPU 时间片来实现这个机制。时间片是 CPU 分配给各个线程的时间,因为时间片非常短,所以 CPU 通过不停地切 换线程执行,让我们感觉多个线程是同时执行的,时间片一般是几十毫秒(ms)。
CPU 通过时间片分配算法来循环执行任务,当前任务执行一个时间片后会切换到下一个任务。但是,在切换前会保存上一个任务的状态,以便下次切换回这个任务时,可以再加载这 个任务的状态。所以任务从保存到再加载的过程就是一次上下文切换。
上下文切换会影响多线程的执行速度。
二、如何减少上下文切换
减少上下文切换的方法有无锁并发编程、CAS 算法、使用最少线程和使用协程。
-
无锁并发编程:多线程竞争锁时,会引起上下文切换,所以多线程处理数据时,可以用一 些办法来避免使用锁,如将数据的 ID 按照 Hash 算法取模分段,不同的线程处理不同段的数据。
-
CAS算法:Java 的 Atomic 包使用 CAS 算法来更新数据,而不需要加锁。
-
使用最少线程:避免创建不需要的线程,比如任务很少,但是创建了很多线程来处理,这 样会造成大量线程都处于等待状态。
-
协程:在单线程里实现多任务的调度,并在单线程里维持多个任务间的切换。
三、死锁
这段代码会引起死锁,使线程 t1 和线程 t2 互相等待对方释放锁。
public class DeadLockDemo {
private static final String A = "A";
private static final String B = "B";
public static void main(String[] args) {
new DeadLockDemo().deadLock();
}
private void deadLock() {
Thread t1 = new Thread(() -> {
synchronized (A) {
try {
Thread.sleep(2000);
} catch (InterruptedException e) {
e.printStackTrace();
}
synchronized (B) {
System.out.println("1");
}
}
});
Thread t2 = new Thread(() -> {
synchronized (B) {
synchronized (A) {
System.out.println("2");
}
}
});
t1.start();
t2.start();
}
}
一旦出现死锁,业务是可感知的,因为不能继续提供服务了,那么只能通过 dump 线程查看到底是哪个线程出现了问题,以下线程信息告诉我们是 DeadLockDemo 类的第 26 行和第 19 行引起的死锁。
"Thread-1" #9 prio=5 os_prio=0 tid=0x00007f704c20d800 nid=0x3db3 waiting for monitor entry [0x00007f7035e32000]
java.lang.Thread.State: BLOCKED (on object monitor)
at DeadLockDemo.lambda$deadLock$1(DeadLockDemo.java:26)
- waiting to lock <0x00000000ec460c68> (a java.lang.String)
- locked <0x00000000ec460c98> (a java.lang.String)
at DeadLockDemo$$Lambda$2/303563356.run(Unknown Source)
at java.lang.Thread.run(Thread.java:748)
Locked ownable synchronizers:
- None
"Thread-0" #8 prio=5 os_prio=0 tid=0x00007f704c20b800 nid=0x3db2 waiting for monitor entry [0x00007f703c1f0000]
java.lang.Thread.State: BLOCKED (on object monitor)
at DeadLockDemo.lambda$deadLock$0(DeadLockDemo.java:19)
- waiting to lock <0x00000000ec460c98> (a java.lang.String)
- locked <0x00000000ec460c68> (a java.lang.String)
at DeadLockDemo$$Lambda$1/471910020.run(Unknown Source)
at java.lang.Thread.run(Thread.java:748)
现在我们介绍避免死锁的几个常见方法。 ·避免一个线程同时获取多个锁。
- 避免一个线程在锁内同时占用多个资源,尽量保证每个锁只占用一个资源。
- 尝试使用定时锁,使用 lock.tryLock(timeout)来替代使用内部锁机制。
- 对于数据库锁,加锁和解锁必须在一个数据库连接里,否则会出现解锁失败的情况。
四、资源限制的挑战
4.1 什么是资源限制
资源限制是指在进行并发编程时,程序的执行速度受限于计算机硬件资源或软件资源。
例如,服务器的带宽只有 2Mb/s,某个资源的下载速度是 1Mb/s 每秒,系统启动 10 个线程下载资源,下载速度不会变成 10Mb/s,所以在进行并发编程时,要考虑这些资源的限制。
硬件资源限制有带宽的上传/下载速度、硬盘读写速度和 CPU 的处理速度。软件资源限制有数据库的连接数和 socket 连接数等。
4.2 资源限制引发的问题
在并发编程中,将代码执行速度加快的原则是将代码中串行执行的部分变成并发执行,但是如果将某段串行的代码并发执行,因为受限于资源,仍然在串行执行,这时候程序不仅不会加快执行,反而会更慢,因为增加了上下文切换和资源调度的时间。
例如,之前看到一段程 序使用多线程在办公网并发地下载和处理数据时,导致 CPU 利用率达到 100%,几个小时都不 能运行完成任务,后来修改成单线程,一个小时就执行完成了。
4.3 如何解决资源限制的问题
对于硬件资源限制,可以考虑使用集群并行执行程序。既然单机的资源有限制,那么就让 程序在多机上运行。
比如使用 ODPS、Hadoop 或者自己搭建服务器集群,不同的机器处理不同 的数据。可以通过 “数据ID%机器数”,计算得到一个机器编号,然后由对应编号的机器处理这笔数据。
对于软件资源限制,可以考虑使用资源池将资源复用。比如使用连接池将数据库和 Socket 连接复用,或者在调用对方 webservice 接口获取数据时,只建立一个连接。
4.4 在资源限制情况下进行并发编程
如何在资源限制的情况下,让程序执行得更快呢?方法就是,根据不同的资源限制调整程序的并发度,比如下载文件程序依赖于两个资源——带宽和硬盘读写速度。有数据库操作时,涉及数据库连接数,如果SQL语句执行非常快,而线程的数量比数据库连接数大很多,则某些线程会被阻塞,等待数据库连接。