多进程编程总结

进程:

进程的创建:

pid_t fork(void);

该函数每次调用都会返回两次,在父进程中返回子进程ID,在子进程中返回0,所以当fork()==0的时候就是子进程了,失败就返回-1


fork函数做的工作:

fork函数复制当前进程,在内核进程表中创建一个新的进程表项。

新的进程表项有很多属性和原进程相同:比如堆指针,栈指针,和标志寄存器的值

新的进程表项属性与原进程不同:该进程的PPID被设置成原进程的PID,信号位图被清除(原进程设置的信号处理函数对现进程无效)

创建子进程后,父进程中打开的文件描述符默认在子进程中也是打开的,且文件描述符的引用计数加1。


父子:

子进程的代码和父进程完全相同,同时它还会复制父进程的数据(堆数据,栈数据和静态数据)

数据复制采用的是所谓的写时复制,也就是在任一进程(父子都可以)对数据执行了写操作时,复制才会发生(先是缺页中断然后操作系统给子进程分配内存并复制父进程的数据)


子进程的应用:

当我们需要在子进程中执行其他程序,也就是替换当前进程程序的时候这就需要使用exec系列函数,这个我总结过了。


僵尸进程:

(1)对于多进程程序而言,父进程一般需要跟踪子进程的退出状态,因此,当子进程结束运行时,内核不会立即释放该进程的进程表表项,以满足父进程后续对该子进程退出信息的查询(如果父进程还在运行)。在子进程结束,父进程读取其退出状态前,我们称该子进程处于僵尸态,也就是僵尸进程。

(2)另一种产生原因是父进程结束或者异常中止而子进程继续运行,那么此时子进程的PPID将被操作系统设置为1,也就是init接管了他,并等待他结束,那么在父进程结束,子进程退出前,改进程还是僵尸态。


根本原因:

故可见只要父进程没有正确的处理子进程的返回信息,子进程都将停留在僵尸态,并占据内核资源,显然这不能被容许。


解决方案:

#include <sys/types.h>

#include <sys/wait.h>

pid_t wait(int* stat_loc);

pid_t waipid(pid_t pid,int *stat_loc,int options);


wait函数作用:wait函数将阻塞进程,直到该进程的某个子进程结束运行为止。返回结束运行的子进程的PID,并将该子进程的退出状态信息存储于stat_loc参数指向的内存中。


waitpid函数的作用:waitpid只等待由pid参数指定的子进程,如果pid取值为-1,那么它和wait函数相同,等待任意一个子进程结束,stat_loc参数的含义和wait函数的stat_loc相同,options参数可以控制waitpid函数的行为。该参数最常用的取值是WNOHANG,作用是:当pid指定的目标子进程还没有结束或者意外中止,那么waitpid立即返回0,如果目标子进程确实正常退出了,则waitpid返回该子进程的PID,waitpid调用失败时返回-1,并设置errno。


信号SIGCHLD表明的是子进程的退出, 父进程可以通过捕获SIGCHLD信号在信号处理函数中调用waitpid彻底结束一个子进程。


管道:不止可以实现进程内部的通信,实际上,管道也是父进程和子进程间通信的常用手段。


能够使用管道通信的原理:利用的是fork调用之后两个管道文件描述符(fd[0]和fd[1])都保持打开,一个这样的文件描述符只能保证父,子进程间一个方向的数据传输,父进程和子进程必须有一个关闭fd[0],另一个关闭fd[1]。(所以如果你想双向数据传输那么就需要两个管道)


信号量原语:解决进程间同步问题的方法


P,V操作

P(SV):如果SV的值大于0,就把它减一;如果SV的值为0,则挂起进程的执行。

V(SV):如果有其他进程因为等待SV而挂起,则唤醒之;如果没有,则将SV加1。

过程如下:

A,B共用一部分关键代码,SV初始值为1,当A,B同时去用,假设A先P操作,那么B再P会被挂起,直到A执行完了,然后调用B,唤醒了B


使用一个普通变量来模拟二进制信号量是行不通的,因为所有的高级语言没有一个原子操作可以同时完成如下两部操作:检测变量是否为true/false,如果是则再将它设置为false,true


linux下信号量的API:

#include <sys.sem.h>

int semget(key_t key,int num_sems,int sem_flags);


int sem_id = semget(IPC_PRIVATE,1,0666);


key:是一个键值,用来标识全局唯一的信号量集,就像文件名全局唯一标识一个文件一样,要通过信号量通信的进程需要使用相同的键值来创建,获取该信号量。

num_sems:指定要创建/获取的信号量集中信号量的数目,如果是创建信号量,那么他就必须被指定,如果是获取已经存在的信号量,可以把它设置成0。

sem_flags参数指定一组标志

semget成功时返回一个正整数值,它是信号量集的标识符:semget失败时返回-1,并设置errno。


semop系统调用改变信号量的值,即执行P,V操作。

//op-1执行p,op为1执行v

void pv(int sem_id,int op)

{

struct sembuf sem_b;

sem_b.sem_num = 0;

sem_b.sem_op = op;

sem_b.sem_flg = SEM_UNDO;

semop(sem_id,&sem_b,1);

}



int semop(int sem_id,struct sembuf* sem_ops,size_t num_sem_ops);

sem_id:是由semget调用返回的信号量集标识符,指定目标信号量集

sem_ops参数指向一个sembuf结构体类型的数组(这里面还有许多内部操作,那就由代码来说明)

num_sem_ops指定要执行的操作个数。

成功返回0,失败返回-1


semctl系统调用允许调用者对信号量进行直接控制,其定义如下:

#include <sys/sem.h>

int semctl(int sem_id,int sem_num,int commadn, ...);

可以用来初始化信号量也可以用来删除信号量。


semctl(sem_id,0,SETVAL,sem_un);

semctl(sem_id,0,IPC_RMIDsem_un);


sem_id是semget调用返回的信号量集标识符,用以指定被操作的信号量集。

sem__num参数指定被操作的信号量在信号量中的编号。

command参数指定要执行的命令。



特殊键值IPC_PRIVATE

semget的调用者可以給其key参数传递一个特殊的键值IPC_PRIVATE(其值为0),这样无论信号量是否已经存在,semget都将创建一个新的信号量。使用改建创建的信号量并非像他名字那样是私有的,其他进程尤其是子进程都有方法访问到他。


这些函数的具体应用例子:

#include <sys/sem.h>
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/wait.h>


union semun
{
    int val;
    struct semid_ds* buf;
    unsigned short int* array;
    struct seminfo* __buf;
};


//op是-1那么p操作,op是1那么v操作


void pv(int sem_id,int op)
{
    struct sembuf sem_b;
    sem_b.sem_num = 0;
    sem_b.sem_op = op;
    sem_b.sem_flg = SEM_UNDO;
    semop(sem_id,&sem_b,1);
}


int main(int argc,char* argv[])
{
    int sem_id = semget(IPC_PRIVATE,1,0666);


    union semun sem_un;
    sem_un.val = 1;
    semctl(sem_id,0,SETVAL,sem_un);


    pid_t id = fork();
    if(id<0)
    {
         return 1;
    }
    else if(id==0)
    {
        // printf("child try to get binary sem\n");
         //父子进程间共享IPD——PRIVATE信号量的关键就在于二者都可以操作
         //该信号量的标识符sem_id
         pv(sem_id,-1);
         printf("child get the sem and would release it after 5 seconds\n");
         sleep(5);
         pv(sem_id,1);
         exit(0);
    }
    else
    {
         printf("parent try to get binary sem\n");
         pv(sem_id,-1);
         sleep(5);
         printf("parent get the sem and would release it after 5 seconds\n");
         pv(sem_id,1);
    }
    waitpid(id,NULL,0);
    semctl(sem_id,0,IPC_RMID,sem_un);//删除信号量
    return 0;
}


共享内存:

最高效的IPC机制,因为它不涉及进程之间的任何数据传输。

但是我们必须用其他辅助手段来同步进程对共享内存的访问,否则会产生竞态条件。

因此,共享内存通常和其他进程间通信方式一起使用。

头文件:#include <sys/shm.h>

int shmget(key_t key,size_t size,int shmflg);

key是一个键值,用来标识一段全局唯一的共享内存大。

size参数指定共享内存的大小,单位是字节,如果是创建新的共享内存,那么size的值要被指定,如果是获取已经存在的共享内存,那么就可以把size设置成0。

shmflg参数的使用和含义与semget系统调用的sem_flags参数相同,不过shmget支持两个额外标志

SHM_HUGETLB

SHM_NORESERVE

成功返回正整数值,失败返回-1

若是用于创建共享内存,那么共享内存所有字节都是0,与之关联的结构体shmid_ds会被创建且初始化。


共享内存被创建/获取后,我们不能立即访问它,而是需要先将它关联到进程的地址空间中。

使用完毕之后,我们同样需要将它从进程地址空间中分离。

#include <sys/shm.h>

void *shmat(int shm_id,const void* shm_addr,int shmflg);//关联

int shmdt(const void* shm_addr);//分离


shmat成功时返回共享内存被关联到的地址,失败返回(void*)-1,并返回errno。

shmat成功时也会修改shmid_ds的部分字段


shmdt函数将关联到shm_addr处的共享内存从进程中分离,成功返回0,失败则返回-1并设置errno,shmdt在成功调用的时候将修改内核数据结构shmid_ds的部分字段。


shmctl

用以控制共享内存的某些属性

#include <sys/shm.h>

int shmctl(int shm_id,int command,struct shmid_ds* buf);

shm_id参数是由shmget调用返回的共享内存标识符,command参数指定要执行的命令

失败返回-1,成功等我返回值取决于command参数。


共享内存的POSIX方法
#include <sys/nman.h>
#include <sys/stat.h>
#include <fcntl.h>


int shm_open(const char* name,int oflag,mode_t mode);
shm_open的使用方法与open系统调用完全相同。


name:指定要创建/打开的共享内存对象,最好使用/somename,这样可以保证可移植性


oflag指定创建方式,比如可读可写


调用成功时候返回一个文件描述符,该文件描述符可用于后续的nmap调用。


删除函数:shm_unlink(const char* name);


消息队列:在两个进程之间传递二进制块数据的一种简单有效的方式。
Linux消息队列的API都定义在sys/msg.h头文件中:
#include <sys/msg.h>
msgget
msgsnd
msgrcv
msgctl


int msgget(key_t key,int msgflg);//总结到这个地方发现无论消息队列,共享内存,还是信号量集,他们的模式都是靠四个函数
函数成功时返回一个正整数值,他是消息队列的标识符,失败返回-1并设置ernno。


消息队列创建成功,内核中的msqid_ds将被创建并初始化。

int msgsnd(int msqid,const void* msg_ptr,size_t msg_sz,int msgflg);

msqid参数是msgget调用返回的消息队列标识符。
msg_ptr参数指向一个准备发送的消息,消息必须是如下格式
struct msgbuf
{
     long mtype;//消息类型
     char mtext[512];//消息数据
};
msg_sz指定消息数据部分的长度,这个长度也可以为0,表示没有消息数据。


msgflg参数控制msgsnd的行为,它通常支持IPC_NOWAIT标志,也就是用非阻塞的方式发送消息。默认情况下,发送消息时如果消息队列满了,则msgsnd将阻塞。


msgrcv系统调用:
int msgrcv(int msqid,void* msg_ptr,size_t msg_sz,long int msgtype,int msgflg);


msqid同上
msg_ptr用于存储接收的消息
msg_sz参数指的是消息数据部分
msgtype指定接受何种类型的消息


msgtype等于0,读取消息队列中的一个消息。
大于0,读取消息队列中的一个类型为msgtype的消息。


int msgctl(int msqid,int command,struct msqid_ds* buf);


command指定的是命令




ipcs可以用来查重系统上有哪些共享资源实例。




在进程间传递文件描述符:
由于fork调用后,父进程中的文件描述符在子进程中仍然保持打开,所以文件描述符可以很方便的从父进程传递到子进程。


传递方式:
并不是传递一个文件描述符的值,而是在接收进程中创建一个新的文件描述符,并且该文件描述符和发送进程中的被传递的文件描述符指向内核中相同的文件表项
子进程的文件描述符也可以传递给父进程。//0输入 1输出 2错误



  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值