《Java Concurrency in Practice》是java并发编程领域的经典书籍,本人认为是最好的;本系列文章算是该书2006版本(虽然有一定年头,但内容一点不过时)的读书笔记。
本书第一部分只有一章,介绍多线程的一些背景知识,权当热身。
为什么要使用多线程?
早年间,计算机的性能还比较弱的时候,大家使用多线程(进程)的动机主要是以下几点:
-
充分利用资源
当一个操作需要阻塞时(比如等待IO完成),可以通过线程调度让出CPU,让其他线程有来执行,能够充分利用CPU计算能力; -
提供公平性
让不同的用户、不同的程序以分时的方式来共享CPU; -
对程序员友好的问题解决模型
用途多线程可以分解复杂问题,每个线程解决一个子问题,通过线程同步机制与其他线程协调;这样一来,每个线程的代码复杂度大大降低,并且能够以一种”线性“的视角来解决子问题。
现今,上面这些理由仍然成立,但是有了一个额外的动机:随着摩尔定律失效,单个处理器的计算能力已经无法再大幅提升,服务器通过集成更多的CPU核来提升性能,一个单线程的程序是无法利用多核CPU的计算能力的。
多线程无处不在
JVM利用多线程做垃圾收集,java的Timer也使用多线程。各种常见的framework,基本都是以多线程的模式工作的;比如Servlet,RMI等,它们以回调接口的形式调用开发者编写的代码,这样后者也工作在多线程模式下(尽管开发者没有手动创建线程)。
所以做服务端开发,是无法绕开多线程话题的,无论使用何种语言。
多线程的风险
如何事情都有两面性,线程也不列外,使用多线程会给程序带来以下三种风险。
-
安全风险
多线程运行的代码,如果没有合适的同步机制,可能导致错误的运行结果;
因为多线程共享进程的内存地址空间,一个线程正在使用的数据,可能意外地被另外一个线程修改。
因此要保证程序正确性,多个线程对同一个数据的访问必须通过某种方式协调起来,这种协调机制又叫做线程同步。 -
活性风险
如果某个资源被一个线程独占,那么其他需要使用该资源线程要等到前者释放才能继续执行;如果前者一直不释放,那么后者就永远处于挂起状态。 -
性能风险
线程同步措施会迫使线程挂起,还会妨碍编译器、jvm、以及CPU对代码进行性能优化;另外,CPU调度线程本身就需要消耗一定的计算能力:每个线程需要消耗一定内存,从一个线程切换到另一个线程,引入上下文切换的开销。如果使用不当,多线程带来性能增益会被引入的消耗平衡掉,甚至还不如单线程性能优越。