Linux高性能服务器编程学习记录——十三、多进程编程

本文深入探讨Linux服务器编程中的多进程技术,包括fork、exec系列调用、处理僵尸进程、管道、信号量、共享内存、消息队列等。详细介绍了这些进程间通信(IPC)机制的使用和重要性,对于理解和实现高性能服务器编程至关重要。
摘要由CSDN通过智能技术生成

1、fork系统调用

Linux下创建新进程的系统调用是fork

#include <sys/types.h>
#include <unistd.h>
pid fork(void);

该调用返回两次,父进程中返回子进程的pid,子进程中返回0,失败返回-1,并设置errno。
fork复制当前进程,在内核进程表中创建一个新的进程表项。新的进程表项有很多属性和原进程相同,比如堆指针、栈指针和标志寄存器的值。也有一些属性被赋予新的值,比如新进程的ppid会被设为原进程的pid,信号位图被清除(原进程设置的信号处理函数不再对新进程生效)。
子进程的代码与父进程完全相同,同时还会复制父进程的数据(堆、栈、静态数据)。数据的复制采用写时复制。
在父进程中打开的fd,在子进程中也是打开的,且其引用计数会加1,所以如果不需要的话,莫要忘记关闭。

2、exec系列系统调用

exec系列系统调用定义如下:

#include <unistd.h>
extern char** environ;

int execl(const char* path, const char* arg, ...);
int execlp(const char* file, const char* arg, ...);
int execle(const char* path, const char* arg, ..., char* const envp[]);
int execv(const char* path, char* const argv[]);
int execvp(const char* file, char* const argv[]);
int execve(const char* path, char* const argv[], char* const envp[]);

path参数指定可执行文件的完整路径,file参数可以接受文件名(可执行文件),该文件的具体位置则在环境变量PATH中搜寻。arg接受可变参数,argv则接受参数数组。无论是使用arg还是argv,由于参数数量都是任意的,所以需在参数最后传一个NULL来标记参数表的结束。envp参数用于设置新程序的环境变量,如果未设置,则新程序使用由全局变量environ指定的环境变量。
实际上这一组函数完成的是一样的功能,即执行指定程序来替换当前进程映像。什么意思呢,我们知道,调用fork后,子进程会继承父进程的很多东西,跟父进程有着千丝万缕的关系,但是如果,在fork后立即调用exec系系统调用,那么会用exec指定的程序“替换”子进程原本的程序,除了一些“表象”的,无关紧要的一些数据,如ppid,你可以认为新fork出来的进程与调用fork的进程基本没什么关系了。写时复制机制在这里发挥了它的作用。
exec系列调用成功后没有返回值(因为进程空间中的程序已被替换,不再是调用exec时的程序),失败返回-1。

#include <sys/types.h>
#include <stdio.h>
#include <unistd.h>
#include <sys/wait.h>
#include <stdlib.h>

int main()
{
   
    printf("main process %d\n", getpid());
    pid_t pid = fork();
    if (pid < 0)
    {
   
	    printf("fork error\n");
    }
    else if (pid == 0)
    {
   
        printf("sub process %d exec ls -l \n", getpid());
        execlp("ls", "ls", "-l", NULL);
        printf("execlp error \n");
        exit(1);
    }
    else
    {
   
	    wait(NULL);
    }
    return 0;
}

exec函数不会关闭原程序打开的fd,除非该fd被设置了类似SOCK_CLOEXEC的属性。

3、处理僵尸进程

子进程先于父进程退出,而父进程并没有回收子进程,释放子进程占用的资源,此时称子进程为僵尸进程。如果父进程先于子进程退出,子进程会被init进程托管,此后由init进程负责子进程的回收的资源释放。
避免子进程成为僵尸进程的办法是在父进程中调用下面的函数以等待子进程的结束:

#include <sys/types.h>
#include <sys/wait.h>
pid_t wait(int* stat_loc);
pid_t waitpid(pid_t pid, int* stat_loc, int options);

wait函数将阻塞进程,直到某个子进程结束运行,返回该子进程的pid,子进程的退出状态信息存储与stat_loc指向的内存中。
定义在sys/wait.h中的几个宏可以帮助解释子进程退出时的状态信息
在这里插入图片描述
waitpid只等待由pid指定的子进程。如果pid为-1,则等待任意子进程结束。options可以控制waitpid的行为,通常取值WNOHANG,表示waitpid将是非阻塞的:如果pid指定的目标子进程还没结束或意外终止,waitpid立即返回0,如果目标子进程已正常退出,则返回子进程pid。waitpid调用失败返回-1,并设置errno。
子进程在结束时会向其父进程发送一个SIGCHLD信号,父进程由此得知子进程已经退出了。下面是SIGCHLD信号的典型处理函数

static void handle_child(int sig)
{
   
	pid_t pid;
	int stat;
	while((pid = waitpid(-1, &stat, WNOHANG)) > 0)
	{
   
		// 善后处理
	}
}

4、管道

fork调用后,父进程中打开的fd在子进程中也是打开的,所以可以通过管道来实现父子进程的通信。
通常使用socketpair创建父子进程间通信的管道,以在两边都能读写。

5、信号量

信号量主要用于对进程同步,也就是确保任意时刻只有一个进程能进入临界区。
信号量是一种特殊的变量,它只能取自然数值并且只支持两种操作,在Linux/UNIX中,称为P、V操作。假设有信号量SV,则对它的PV操作含义如下
P(SV):如果SV的值大于0,就将它减1,如果SV的值为0,则挂起进程的执行
V(SV):如果有其他进程因为等待SV而挂起,则唤醒之,否则,将SV加1
可以看出,进程在进入临界区前需执行P操作,退出临界区前需执行V操作。
信号量的取值可以是任何自然数,但最常用的是二进制信号量,即只取0和1两个值。
注意:使用一个普通变量来模拟二进制信号量是行不通的,因为所有高级语言都没有一个原子操作可以同时完成如下两步操作:检测变量是否为true/false,如果是则再将它设置为false/true。
Linux信号量的API主要包含3个系统调用:semget、semop、semctl。它们都被设计为操作一组信号量,即信号量集,而不是单个信号量。

#include <sys/sem.h>
int semget(key_t key, int num_sems, int sem_flags);
int semop(int sem_id, struct sembuf* sem_ops, size_t num_sem_ops);
int semctl(int sem_id, int sem_num, int command, ...);

semget用于创建一个新的信号量集或者获取一个已经存在的信号量集。key是一个键值,用来标识一个全局唯一的信号量集。num_sems指定要创建/获取的信号量集中信号量的数目,获取时可以设为0,创建时则必须指定值。sem_flags指定一组标志,其低9位时该信号量的权限,其格式和含义与系统调用open的mode参数相同。semget成功返回信号量集的标识符,一个正整数,失败返回-1,并设置errno。
semop是改变信号量的值,即执行P、V操作。sem_id是semget的返回值,用于指定要操作的信号量集。num_sem_ops指定要执行的操作个数,即sem_ops数组中元素的个数。sem_ops指向的sembuf定义如下:

struct sembuf
{
   
	unsigned short int sem_num;	//信号量集中信号量的编号,0是第一个
	short int sem_op; //操作类型,可选正整数、0、负整数,每种类型的操作行为受sem_flg影响
	short int sem_flg;//可选值是IPC_NOWAIT(无论操作是否成功,semop都立即返回,非阻塞)和SEN_UNDO(当进程退出时取消正在进行的semop操作)
}

semop成功返回0,失败返回-1,设置errno。失败是sem_ops中指定的所有操作都不执行。
semctl对信号量进行直接控制。sem_num指定被操作的信号量在信号量集中的编号。command指定要执行的命令,第4个参数由用户自己定义,但sys/sem.h中给出了它的推荐格式:

union semun
{
   
	int val; 				//用于SETVAL命令
	struct semid_ds* buf;	//用于IPC_STAT和IPC_SET命令
	unsigned short* array;	//用于GETALL和SETALL命令
	struct seminfo* __buf;	//用于IPC_INFO命令
}

semctl支持的所有命令如下
在这里插入图片描述
semctl成功时的返回值取决于command参数,失败返回-1,设置errno。
可以给semget传一个特殊的键值IPC_PRIVATE(值为0)来强制创建一个新的信号量,下面是书中代码清单13-3使用IPC_PRIVATE信号量的源码:

#include <sys/sem.h>
#include <iostream>
#include <stdlib.h>
#include <unistd.h>
#include <sys/wait.h>

union semun
{
   
	int val;
	struct semid_ds* buf;
	unsigned short int* array;
	struct seminfo* __buf;
};

/* op为-1时执行P操作,op为1时执行V操作 */
void pv(int sem_id, int op)
{
   
	struct sembuf sem_b
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值