另一篇讲进程和线程的文章

最新推荐文章于 2024-07-11 15:53:19 发布

norbe

最新推荐文章于 2024-07-11 15:53:19 发布

阅读量952

点赞数

分类专栏：杂七杂八文章标签： access 任务多线程 thread file dos

杂七杂八专栏收录该内容

4 篇文章 0 订阅

订阅专栏

一、进程和线程

一个正在执行的程序叫作进程(process), 进程要占用系统资源。进程执行过程中的控制线索叫作线程(Thread), 程序计数器的状态及CPU中其它寄存器的状态显示了该控制线索。

二、为什么需要多进程/线程

记得DOS时有个程序被大家奉为后台操作的经典，那就是Print.EXE（由MS提供），用于后台打印，可从一定程度上实现多任务，但DOS并不是一个多任务的环境，所以勉强实现多任务时限制太多。随后有了Win 3.X，虽然OS支持多任务，但严格说来对多进程的支持并不够，主要表现在进程间通信方面提供的支持很少，一些传统IPC方式都没提供。后来在WinNT上完全实现了多进程/多线程支持，当然现在的Win9X/2K都完全提供这方面的支持。

什么是进程（Process）：普通的解释是，进程是程序的一次执行。

什么是线程（Thread）：线程可理解为进程中执行的一段程序片段。在多任务环境中，下面的概念可帮我们理解两者间差别：

进程间是独立的，这表现在内存空间，上下文环境，而线程运行在进程空间内。一般来讲(不使用特殊技术)进程是无法突破进程边界存取其他进程内的存储空间，而线程由于处于进程空间内，所以同一进程所产生的线程共享同一内存空间。

同一进程中的两段代码不能够同时执行，除非引入线程。线程是属于进程的，当进程退出时，该进程所产生的线程都会被强制退出并清除。线程占用的资源要少于进程所占用的资源。

进程和线程都可以有优先级。在线程系统中，进程也是一个线程。可将进程理解为一个程序的第一个线程。一个最简单的例子就是在屏幕上画多个跳动的小球，我们对每个球的绘制都可采用一个线程来完成。但象这样的线程间完全独立没有影响和数据交换的情况是很少的。

下面我们看一个例子，一个应用要完成两个任务：每次产生1000个随机数写入文件并从文件中读出数据并以该随机数为圆心画圆，对该操做进行100次，并使用100个不同的文件保存文件。传统做法如下：

void do_this(void){

for(int i=0; i<100; i++){

/// step 1：generate 1000 randam number；write to file；

/// step 2：read from file；draw circle；

}

如果引入多进程的概念，则实现方法可以改为：

void do_this(void){

CreateProcess("do_rand.exe",...);

CreateProcess("draw_circle.exe",...);

}

//do_rand.exe

void do_rand(void){
for(int i=0;i<100;i++){

/// step 1：

generate 1000 randam number;

write to file;
wait draw_circle finish last task
tell draw_cricle data ready

}

//draw_circle.exe
void draw_circle(void){

for(int i=0;i<100;i++){

/// step 2

set flag of last task finish
wait data ready
read from file;
draw circle;

}
}

在多进程中我们引入更多的控制手段，首先do_rand在准备好数据后必须等待draw_circle处于空闲状态，这样做的原因是：只有一个进程在进行画圆操作，所以必须保证当前提交的data ready请求能够被接收。由于使用了不同的文件所以不需要对文件的使用情况也进行判断。

如果使用线程，我们可以进一步的改造程序，取消使用文件来保存数据，而用全局变量来保存数据：

void do_this(void){

CreateThread("do_rand",...);//参数为线程入口而不是执行程序
CreateThread("draw_circle",...);

}
global int giRandNum[1000];
void do_rand(void){

for(int i=0;i<100;i++){

/// step 1

local int iRandNum[1000];

generate 1000 randam number;

get access of giRandNum;

memcpy(giRandNum,iRandNum,...);

release access of giRandNum;

wait draw_circle finish last task

tell draw_cricle data ready
}

}
void draw_circle(void){

for(int i=0;i<100;i++){

/// step 2

set flag of last task finish
wait data ready
local int iRandNum[1000];
get access of giRandNum;
memcpy(iRandNum,giRandNum,...);
release access of giRandNum;
draw circle;

}
}

这里使用全局变量保存数据，而程序使用的资源要小于前面使用进程的情况，且效率相同。这里引入对全局数据使用情况的判断，是为保证全局数据在被draw_circle读取的时候不会被do_rand修改。这就是一个数据同步的概念。

通过上面的例子可以看出使用多线程时可提高效率又能够节省资源。最后一点线程在单CPU主机上与多进程相比是没有的效率上的提高，而在多CPU的主机上不同的线程代码可以分配到不同的主机上执行。但多进程/线程与单进程相比的在效率和速度上的优点很很明显的。

随着多线进程/程序的采用同时也会产生很多其他的问题，比如数据如何交换（在上面的例子中我们使用文件来保存中间数据，当然还有很多的方法来在进程间交换数据），数据如何同步（保证某些数据在同时只被一段代码进行写操作），如何协调进程/线程间的操作（一个进程的继续执行是否要等待其他进程完成某些操作）。