小白科普:线程和线程池

软件大师又要给弟子开小灶了,这次是线程和线程池。

软件大师正在闭目修炼, 最小的一名弟子慢慢走了进来。


大师,最近我在学习线程,有很多迷惑的地方。

说来听听,让为师给你排解一下。


第一个问题问题就是为什么要多线程啊, 我看了操作系统中的多进程管理,不是挺好的吗? 多线程似乎没有必要啊!


不错,多问问为什么,总是有好处的。所谓线程,就是程序代码的执行,一个进程至少得有一个线程,要不然,这个进程怎么运行? 对吧?



这个我理解。

以你常用的Word为例,假设这个进程没有多线程(或者说它只有一个线程), 如果它有个定时保存文档的功能,你想象下,当这个自动保存的功能在运行的时候,你还能继续输入文字吗?


不能

对,这就是问题所在了,单线程只能干一件事情,无法并发和并行。直接导致用户体验不好。CPU快速的运算能力,还有多核,就被浪费了。


那我完全可以用多进程来处理啊, 一个进程来接受用户输入文字,另外一个进程来自动保存。

是可以这么做,但进程是个重量级的家伙,并且进程之间是隔离的,他们要想共享数据,例如被编辑的文件内容,那是非常麻烦的。


原来如此。

古人云:进程是拥有资源的基本单位, 线程是CPU调度的基本单位,这句话你理解吗?


不是特别明白......

举个例子,有两个进程,一个是Word, 一个是QQ音乐。 Word 进程打开了文件,这是它的资源,QQ音乐打开了Socket,这也是它的资源。


假设Word有两个线程:T1负责接受用户的文字输入,T2 负责自动保存。


QQ音乐也有两个线程:T3负责从Socket中读取数据,T4负责对音乐数据进行解码。


操作系统在做调度的时候,基本单位不是Word,QQ音乐这样的进程,而是T1, T2,T3,T4这些线程。明白了吗?



(点头)原来每个线程执行的都是进程代码的某个片段啊! 对了,我听师兄们在讨论什么Java多线程编程,说是很复杂,但是他们从来没提到过Java 多进程编程,这是怎么回事啊?

不错,你的师兄们都没有想到这个问题,看来你已经开始思考了。我先问你,你写的Java程序是不是运行在JVM中? 对操作系统来说,JVM是个什么东西?


嗯... JVM其实就是java.exe运行起来,那它肯定是个进程了。


那在一个进程中还能进行多进程编程吗?


(恍然大悟)奥,那是肯定不行了,Java程序运行在JVM当中, JVM这个进程其实就是他们的容器。 我听说Python, Ruby 等动态语言也都有虚拟机, 这么说他们也可以进行多线程编程了

是啊,虚拟机是个好东西,你们真是遇上了好时候啊, 不用再费劲心机去操作内存。这虚拟机还能屏蔽操作系统的差异,你写的程序可以在任意的支持该语言虚拟机的操作系统中运行。 可移植性很重要,要不然,你在Mac/Windows上开发的程序怎么能不加修改地放到Linux上去运行呢?


我在Java 中创建了一个Thread对象,为什么要调用start方法才能启动线程? 为什么不能直接调用run方法呢?

你要是直接调用run()方法,会是什么效果?


就是用当前线程去执行一个普通函数而已,根本没有什么新线程创建出来。

这就对了,你想创建一个新的线程出来,肯定得有准备工作啊,设置好这个线程的上下文,比如这个线程的栈(用于函数调用),线程的状态,这个线程的PC(Program Counter)等等一系列信息以后,这个线程才可以被调度, 一旦被调度,就会执行那个run()方法了。


明白了大师,还有一个问题,既然线程是属于进程的,可以共享进程的资源, 那创建一个线程应该很轻松啊,为什么要有线程池这个东西呢?

虽然线程是个轻量级的东西, 但是对于互联网应用来说,如果每个用户的请求都创建一个线程,那会非常得多,服务器也是难于承受, 再说了,众多的线程去竞争CPU,不断切换,也会让CPU调度不堪重负,很多线程将不得不等待。所以前辈们的思路就是(1)用少量的线程 (2) 让线程保持忙碌


奥,就是说只创建一定数量的线程,让这些线程去处理所有的任务,任务执行完了以后,线程并不结束,而是回到线程池中去,等待接受下一个任务。



这些线程可以预先创建,任务来了就不用临时再创建了,立刻开始服务。



预先创建? 您刚才不是说线程是程序代码的执行吗? 它是个动态的东西,怎么可能预先创建? 如果真的创建起来了,就会调用run方法, 马上执行完了, 线程就结束了!


你忘了重要的一点,线程的状态。 当线程池的线程刚创建时,让他们进入阻塞状态:等待某个任务的到来。 如果任务来了,那就好办,唤醒其中一个线程,让它拿到任务去执行即可。


可是怎么让他们进入阻塞状态?

看来之前的图我白画了, BlockingQueue听说过没有? 没听说过? 其实很简单,就是一个线程调用它的take()方法取数据时, 如果这个Queue中没有数据,该线程会阻塞;同样,一个线程调用它的put方法放数据时,如果Queue满了, 也会阻塞。




奥,看来线程池中每个线程的run()方法中,要设置一个循环,每次都尝试从BlockingQueue中获取任务,如果Queue是空的,就阻塞等待, 如果有任务来了,就会通知到线程池的某一个线程去处理,处理完了以后,依然试图从BlockingQueue中获取任务,就这么依次循环下去。


线程池中的Worker线程:
public class WorkerThread extends Thread {

   private BlockingQueue<Task> taskQueue = null;
   private boolean       isStopped = false;
   //持有一个BlockingQueue的实例
   public WorkerThread(BlockingQueue<Task> queue){
       taskQueue = queue;
   }

   public void run(){
       while(!isStopped()){
           try{
               Task task = taskQueue.take();
               task.execute();
           } catch(Exception e){
               //log or otherwise report exception,
               //but keep pool thread alive.
           }
       }
   }
   ......略......
}


没错,你这个代码是一种简单的实现,我的老朋友Doug Lea大师写了一套非常好的实现,已经被吸收进JDK了,作为java.util.concurrent包的一部分,你直接调用即可,不用自己动手了。


ExecutorService executorService = Executors.newFixedThreadPool(10);

executorService.execute(new Runnable() {
   public void run() {
       System.out.println("Asynchronous task");
   }
});

executorService.shutdown();


(完)



Linuxer是专业的Linux及系统软件技术交流社区,Linux系统人才培养基地,企业和Linux人才的连接枢纽。


查看我们精华技术文章请移步:

Linuxer精华文章汇总


求职招聘请移步:

Linuxer: 连接企业和Linux人才的platform总线


扫描二维码关注我们 

如果觉得好,请

转发

转发

转发



阅读更多
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

关闭
关闭
关闭