一.线程与进程的区别
1.调度级别
进程是资源调度的基本单位,线程是处理器调度的基本单位
2.资源
进程拥有自己的地址空间和堆,这些资源是线程共享的,线程也拥有独享的资源,比如程序计算器,寄存器,栈等。所以,进程切换开销会比线程开销大。
3.通信方式:
进程间通信方式主要有:
1.管道(pipe)
2.有名管道(FIFO)
3.信号(Signal)
4.消息(Message)队列
5.共享内存(share memory)
6.信号量(semaphore)
7.套接字(socket)
线程间通信方式主要有:
1.volatile和synchronize关键字
2.等待通知机制,即object的wait(),notify(),notifyAll();
3.管道输入输出
4.Thread.join();
5.threadlocal;
4.健壮性:
多进程程序更健壮,多线程程序只要有一个线程死掉,整个进程也死掉了,而一个进程死掉并不会对另外一个进程造成影响,因为进程有自己独立的地址空间。
二.进程与线程的选择
上面主要罗列了进程与线程的区别,那如何选择肯定也是基于他们的差别。
主要有以下参考方案
1)需要频繁创建销毁的优先用线程
原因请看上面的对比。
这种原则最常见的应用就是Web服务器了,来一个连接建立一个线程,断了就销毁线程,要是用进程,创建和销毁的代价是很难承受的
2)需要进行大量计算的优先使用线程
所谓大量计算,当然就是要耗费很多CPU,切换频繁了,这种情况下线程是最合适的。
这种原则最常见的是图像处理、算法处理。
3)强相关的处理用线程,弱相关的处理用进程
什么叫强相关、弱相关?理论上很难定义,给个简单的例子就明白了。
一般的Server需要完成如下任务:消息收发、消息处理。“消息收发”和“消息处理”就是弱相关的任务,而“消息处理”里面可能又分为“消息解码”、“业务处理”,这两个任务相对来说相关性就要强多了。因此“消息收发”和“消息处理”可以分进程设计,“消息解码”、“业务处理”可以分线程设计。
当然这种划分方式不是一成不变的,也可以根据实际情况进行调整。
4)可能要扩展到多机分布的用进程,多核分布的用线程
原因请看上面对比。
5)都满足需求的情况下,用你最熟悉、最拿手的方式
至于“数据共享、同步”、“编程、调试”、“可靠性”这几个维度的所谓的“复杂、简单”应该怎么取舍,我只能说:没有明确的选择方法。但我可以告诉你一个选择原则:如果多进程和多线程都能够满足要求,那么选择你最熟悉、最拿手的那个。