一、进程和线程
一个正在执行的程序叫作进程(process), 进程要占用系统资源。进程执行过程中的控制线索叫作线程(Thread), 程序计数器的状态及CPU中其它寄存器的状态显示了该控制线索。
二、为什么需要多进程/线程
记得DOS时有个程序被大家奉为后台操作的经典,那就是Print.EXE(由MS提供),用于后台打印,可从一定程度上实现多任务,但DOS并不是一个多任务的环境,所以勉强实现多任务时限制太多。随后有了Win 3.X,虽然OS支持多任务,但严格说来对多进程的支持并不够,主要表现在进程间通信方面提供的支持很少,一些传统IPC方式都没提供。后来在WinNT上完全实现了多进程/多线程支持,当然现在的Win9X/2K都完全提供这方面的支持。
什么是进程(Process):普通的解释是,进程是程序的一次执行。
什么是线程(Thread):线程可理解为进程中执行的一段程序片段。在多任务环境中,下面的概念可帮我们理解两者间差别:
进程间是独立的,这表现在内存空间,上下文环境,而线程运行在进程空间内。一般来讲(不使用特殊技术)进程是无法突破进程边界存取其他进程内的存储空间,而线程由于处于进程空间内,所以同一进程所产生的线程共享同一内存空间。
同一进程中的两段代码不能够同时执行,除非引入线程。线程是属于进程的,当进程退出时,该进程所产生的线程都会被强制退出并清除。线程占用的资源要少于进程所占用的资源。
进程和线程都可以有优先级。在线程系统中,进程也是一个线程。可将进程理解为一个程序的第一个线程。一个最简单的例子就是在屏幕上画多个跳动的小球,我们对每个球的绘制都可采用一个线程来完成。但象这样的线程间完全独立没有影响和数据交换的情况是很少的。
下面我们看一个例子,一个应用要完成两个任务:每次产生1000个随机数写入文件并从文件中读出数据并以该随机数为圆心画圆,对该操做进行100次,并使用100个不同的文件保存文件。传统做法如下:
void do_this(void){
for(int i=0; i<100; i++){
/// step 1:generate 1000 randam number;write to file;
/// step 2:read from file;draw circle;
}
}
如果引入多进程的概念,则实现方法可以改为:
void do_this(void){
CreateProcess("do_rand.exe",...);
CreateProcess("draw_circle.exe",...);
}
//do_rand.exe
void do_rand(void){
for(int i=0;i<100;i++){
/// step 1:
generate 1000 randam number;
write to file;
wait draw_circle finish last task
tell draw_cricle data ready
}
}
//draw_circle.exe
void draw_circle(void){
for(int i=0;i<100;i++){
/// step 2
set flag of last task finish
wait data ready
read from file;
draw circle;
}
}
在多进程中我们引入更多的控制手段,首先do_rand在准备好数据后必须等待draw_circle处于空闲状态,这样做的原因是:只有一个进程在进行画圆操作,所以必须保证当前提交的data ready请求能够被接收。由于使用了不同的文件所以不需要对文件的使用情况也进行判断。
如果使用线程,我们可以进一步的改造程序,取消使用文件来保存数据,而用全局变量来保存数据:
void do_this(void){
CreateThread("do_rand",...);//参数为线程入口而不是执行程序
CreateThread("draw_circle",...);
}
global int giRandNum[1000];
void do_rand(void){
for(int i=0;i<100;i++){
/// step 1
local int iRandNum[1000];
generate 1000 randam number;
get access of giRandNum;
memcpy(giRandNum,iRandNum,...);
release access of giRandNum;
wait draw_circle finish last task
tell draw_cricle data ready
}
}
void draw_circle(void){
for(int i=0;i<100;i++){
/// step 2
set flag of last task finish
wait data ready
local int iRandNum[1000];
get access of giRandNum;
memcpy(iRandNum,giRandNum,...);
release access of giRandNum;
draw circle;
}
}
这里使用全局变量保存数据,而程序使用的资源要小于前面使用进程的情况,且效率相同。这里引入对全局数据使用情况的判断,是为保证全局数据在被draw_circle读取的时候不会被do_rand修改。这就是一个数据同步的概念。
通过上面的例子可以看出使用多线程时可提高效率又能够节省资源。最后一点线程在单CPU主机上与多进程相比是没有的效率上的提高,而在多CPU的主机上不同的线程代码可以分配到不同的主机上执行。但多进程/线程与单进程相比的在效率和速度上的优点很很明显的。
随着多线进程/程序的采用同时也会产生很多其他的问题,比如数据如何交换(在上面的例子中我们使用文件来保存中间数据,当然还有很多的方法来在进程间交换数据),数据如何同步(保证某些数据在同时只被一段代码进行写操作),如何协调进程/线程间的操作(一个进程的继续执行是否要等待其他进程完成某些操作)。