进程的定义:进程是一个具有一定独立功能的程序的一次运行活动,同时也是资源分配的最小单元
程序是指放到磁盘的可执行文件
进程是指程序执行的实例 (./xxx)
进程与程序的区分:
进程是动态的,程序是静态的:程序是有序代码的集合;进程是程序的执行。通常进程不可在计算机之间迁移;而程序通常对应着文件、静态和可以复制
进程是暂时的,程序使长久的:进程是一个状态变化的过程,程序可长久保存
进程与程序组成不同:进程的组成包括程序、数据和进程控制块(即进程状态信息)
进程与程序的对应关系:通过多次执行,一个程序可对应多个进程;通过调用关系,一个进程可包括多个程序。
进程的生命周期:
创建: 每个进程都是由其父进程创建,进程可以创建子进程,子进程又可以创建子进程的子进程 (父 子 孙…)
运行: 多个进程可以同时存在,进程间可以通信 (eg:execl函数开启另一个程序)
撤销: 进程可以被撤销,从而结束一个进程的运行
进程的状态:
执行状态:进程正在占用CPU
就绪状态:进程已具备一切条件,正在等待分配CPU的处理时间片
等待状态:进程不能使用CPU,若等待事件发生则可将其唤醒 (条件不满足睡眠,条件满足进入就绪状态)
(其三个组成成分构成一个循环)
Linux系统是一个多进程的系统,它的进程之间具有并行性、互不干扰等特点。(并行还是时间循环,不是真的独立进行)
也就是说,每个进程都是一个独立的运行单位,拥有各自的权利和责任。其中,各个进程都运行在独立的虚拟地址空间,因此,即使一个进程发生异常,它也不会影响到系统中的其他进程。
Linux下进程地址空间:
进程ID(PID):标识进程的唯一数字
父进程的ID(PPID)
子进程的ID是在父进程的ID(PPID)加一
启动进程的用户ID(UID)
进程互斥:
进程互斥是指当有若干进程都要使用某一共享资源时,任何时刻最多允许一个进程使用,其他要使用该资源的进程必须等待,直到占用该资源者释放了该资源为止
操作系统中将一次只允许一个进程访问的资源称为临界资源。
多个进程因竞争资源而形成一种僵局,若无外力作用,这些进程都将永远不能再向前推进
进程中访问临界资源的那段程序代码称为临界区,为实现对临界资源的互斥访问,应保证诸进程互斥地进入各自的临界区
同步进程:
一组并发进程按一定的顺序执行的过程称为进程间的同步
具有同步关系一组并发进程称为合作进程,
合作进程间互相发送的信号称为消息或事件
进程调度概念:
按一定算法,从一组待运行的进程中选出一个来占有CPU运行。
调度方式:
• 抢占式(高优先级优先调度算法和时间片轮转法结合)
• 非抢占式 (指定进程执行时间,时间结束才能进行下一个)
获取ID
#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main()
{
pid_t pid, ppid;
pid = getpid(); //获取当前进程的进程号
printf("pid = %d\n", pid);
ppid = getppid(); //获取父进程号
printf("ppid = %d\n", ppid);
while (1);
return 0;
}
查man手册: man 2 getpid或者getppid
#include <sys/types.h>
#include <unistd.h>
pid_t getpid(void) 获取本进程ID
pid_t getppid(void) 获取父进程ID
进程创建
#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
#include <stdlib.h>
int main()
{
pid_t pid;
int num = 0;
pid = fork();
if (-1 == pid)
{
perror("fork");
exit(1);
}
else if (0 == pid) //子进程 父子进程执行顺序随机 子进程拷贝了所有的父进程的数据
{
num++;
printf("child num = %d %p %d %d \n", num, &num, pid, getpid());
int i = 2;
while (i--)
{
printf("this is child ...\n");
sleep(1);
}
}
else
{
num++;
printf("parent num = %d %p %d %d\n", num, &num, pid, getpid());
int i = 3;
while (i--)
{
printf("this is parent ...\n");
sleep(1);
}
}
printf("heloworld! %d\n", getpid()); //父子进程都会执行
return 0;
}
在pid=fork()之前,只有一个进程在执行,但在这条语句执行之后,就变成两个进程在执行了,这两个进程的共享代码段,将要执行的下一条语句都是if(pid==0).
两个进程中,原来就存在的那个进程被称作“父进程”,新出现的那个进程被称作“子进程”,父子进程的区别在于进程标识符(PID)不同.
#include <unistd.h>
pid_t fork(void)
功能:创建子进程
fork的奇妙之处在于它被调用一次,却返回两次,它可能有三种不同的返回值
输出结果为:
num = 1
num = 1
num++被父进程、子进程一共执行了两次,为什么count的第二次输出为什么不为2?
因为:子进程的数据空间、堆栈空间都会从父进程得到一个拷贝,而不是共享。
在子进程中对count进行加1的操作,并没有影响到父进程中的count值,父进程中的count值仍然为0
进程创建vfork
#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
#include <stdlib.h>
int main()
{
pid_t pid;
int num = 0;
pid = vfork();
if (-1 == pid)
{
perror("fork");
exit(1);
}
else if (0 == pid) //子进程 子进程先执行
{
num++;
printf("child num = %d %p %d %d \n", num, &num, pid, getpid());
exit(1); //指定子进程的退出状态
}
else //子进程和父进程共享地址空间
{
num++;
printf("parent num = %d %p %d %d\n", num, &num, pid, getpid());
}
return 0;
}
表头文件: #include<unistd.h>定义函数: pid_t vfork(void);函数说明:
vfork()会产生一个新的子进程,其子进程会复制父进程的数据与堆栈空间,并继承父进程的用户代码,组代码,环境变量、已打开的文件代码、工作目录和资源限制等。
子进程不会继承父进程的文件锁定和未处理的信号。
注意,Linux不保证子进程会比父进程先执行或晚执行,因此编写程序时要留意死锁或竞争条件的发生。
文件操作
#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <stdlib.h>
#include <string.h>
#include <sys/types.h>
#include <sys/wait.h>
void readfile(int fd)
{
char buf[32] = {0};
lseek(fd, 0, SEEK_SET);
int ret = read(fd, buf, sizeof(buf));
if (-1 == ret)
{
perror("read");
}
printf("%s\n", buf);
close(fd);
}
void writefile(int fd)
{
char buf[32] = "helloworld";
int ret = write(fd, buf, strlen(buf));
if (-1 == ret)
{
perror("write");
}
}
int main()
{
int fd = open("test", O_RDWR | O_CREAT, 00400 | 00200);
if (-1 == fd)
{
perror("open");
exit(1);
}
pid_t pid = fork();
if (-1 == pid)
{
perror("fork");
exit(1);
}
else if (0 == pid) //子进程读文件 子进程可以继承父进程的文件描述符
{
sleep(1);
readfile(fd);
printf("%d\n", getppid());
exit(10);
}
else
{
writefile(fd);
int status;
//wait(&status); //1、等待子进程结束 2、回收子进程的资源
waitpid(pid, &status, 0); //等待指定的进程结束
if (WIFEXITED(status)) //判断子进程是否正常退出 是则成立
{
printf("子进程正常退出 %d\n", WEXITSTATUS(status)); //获取子进程的退出状态
}
else
{
printf("子进程异常退出!\n");
}
}
return 0;
}
正常的运行结果:
如果不加wait等待函数,那么运行结果就是这样。为什么呢?
这是因为父进程先结束了,父进程是写,子进程先沉睡了一秒,所以父进程先结束了,子进程还在运行。
原进程运行的是就是父进程,加了fork函数才有的子进程,是在父进程基础上运行的,父进程先结束了,子进程就成孤儿进程了,所以才会造成卡顿。
除此之外的还有僵尸进程:
僵尸进程指的是那些虽然已经终止的进程,但仍然保留一些信息,等待其父进程为其收尸。
如何产生?
如果一个进程在其终止的时候,自己就回收所有分配给它的资源,系统就不会产生所谓的僵尸进程了。
僵尸进程产生的过程:
- 父进程调用fork创建子进程后,子进程运行直至其终止,它立即从内存中移除,但进程描述符仍然保留在内存中(进程描述符占有极少的内存空间
- 子进程的状态变成EXIT_ZOMBIE,并且向父进程发送SIGCHLD 信号,父进程此时应该调用 wait() 系统调用来获取子进程的退出状态以及其它的信息。在 wait 调用之后,僵尸进程就完全从内存中移除。
- 因此一个僵尸存在于其终止到父进程调用 wait 等函数这个时间的间隙,一般很快就消失,但如果编程不合理,父进程从不调用 wait 等系统调用来收集僵尸进程,那么这些进程会一直存在内存
所以我们可以加一个等待函数wait,使它等待子进程结束,再结束父进程。
表头文件: #include <sys/types.h>
#include <sys/wait.h>
pid_t wait (int * status)
功能:阻塞该进程,直到其某个子进程退出。
#include <sys/types.h>
#include <sys/wait.h>
pid_t waitpid (pid_t pid, int * status, int options)
功能:
会暂时停止目前进程的执行,直到有信号来到或子进程结束
参数:如果不在意结束状态值,则参数status可以设成NULL。
pid为欲等待的子进程识别码:
pid<-1 等待进程组识别码为pid绝对值的任何子进程。
pid=-1 等待任何子进程,相当于wait()。
pid=0 等待进程组识别码与目前进程相同的任何子进程。
pid>0 等待任何子进程识别码为pid的子进程。
option状态参数,具体查看man手册
exec函数族(在一个进程中打开其他进程)
#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
#include <stdlib.h>
int main()
{
pid_t pid;
int num = 0;
char *argv[] = {"./test", "aaaa", "bbbbb", NULL};
pid = vfork();
if (-1 == pid)
{
perror("fork");
exit(1);
}
else if (0 == pid) //子进程 子进程先执行
{
printf("this is child %d\n", getpid());
//启动新的进程
//execl("/bin/ls", "ls", "-a", "-l", NULL);
//execl("/home/linux/process/test", "./test", "aaaa", "bbbbb", NULL);
execv("/home/linux/process/test", argv);
//execl("/usr/local/bin/madplay", "madplay", "/root/music_list/1.mp3", NULL);
}
else //子进程和父进程共享地址空间
{
printf("this is parent %d\n", getpid());
int status;
wait(&status);
}
return 0;
}
exec用被执行的程序替换调用它的程序。 区别:
fork创建一个新的进程,产生一个新的PID。
exec启动一个新程序,替换原有的进程,因此进程的PID不会改变。
#include<unistd.h>
int execl(const char * path,const char * arg1, …) …可变参数
参数:
path:被执行程序名(含完整路径)。
arg1 – argn: 被执行程序所需的命令行参数,含程序名。以空指针(NULL)结束。
#include<unistd.h>
int execv (const char * path, char * const argv[ ])
参数:
path:被执行程序名(含完整路径)
argv[]: 被执行程序所需的命令行参数数组
表头文件: #include<unistd.h>
定义函数: void _exit(int status);
函数说明
_exit()用来立刻结束目前进程的执行,并把参数status返回给父进程,并关闭未关闭的文件。
此函数调用后不会返回,并且会传递SIGCHLD信号给父进程,父进程可以由wait函数取得子进程结束状态。
为安全起见,我们一般用exit()函数
表头文件: #include<stdlib.h>
定义函数: void exit(int status);
函数说明:
exit()用来正常终结目前进程的执行,并把参数status返回给父进程,而进程所有的缓冲区数据会自动写回并关闭未关闭的文件。
信号通信
信号(signal)机制是Unix系统中最为古老的进程间通信机制,很多条件可以产生一个信号:
1、当用户按某些按键时,产生信号
2、硬件异常产生信号:除数为0、无效的存储访问等等。这些情况通常由硬件检测到,将其通知内核,然后内核产生适 的信号通知进程,例如,内核对正访问一个无效存储区的进程产生一个SIGSEGV信号
3、进程用kill函数将信号发送给另一个进程
4、用户可用kill命令将信号发送给其他进程
下面是几种常见的信号:
§ SIGHUP: 从终端上发出的结束信号
§ SIGINT: 来自键盘的中断信号(Ctrl-C)
§ SIGKILL:该信号结束接收信号的进程
§ SIGTERM:kill 命令发出的信号
§ SIGCHLD:标识子进程停止或结束的信号
§ SIGSTOP:来自键盘(Ctrl-Z)或调试程序的停止执行信号
当某信号出现时,将按照下列三种方式中
的一种进行处理:
1、忽略此信号
大多数信号都按照这种方式进行处理,但有两种信号
决不能被忽略,它们是:
SIGKILL\SIGSTOP。
这两种信号不能被忽略的原因是:
它们向超级用户提供了一种终止或停止进程的方法
2、执行用户希望的动作
通知内核在某种信号发生时,调用一个用户函数。在用户函数中,执行用户希望的处理
3、执行系统默认动作
对大多数信号的系统默认动作是终止该进程
发送信号的主要函数有 kill和raise。
区别:
Kill既可以向自身发送信号,也可以向其他进程发送信号。与kill函数不同的是,raise函数是向进程自身发送信号
#include <sys/types.h>
#include <signal.h>
int kill(pid_t pid, int sig)
int raise(int sig)
kill的pid参数有四种不同的情况:
1、pid>0
将信号发送给进程ID为pid的进程。
2、pid =0
将信号发送给同组的进程。
3、pid < 0
将信号发送给其进程组ID等于pid绝对值的进程。
4、pid =-1
将信号发送给所有进程。
sig全称signall(信号)
输入信号的名字或者代表数子字符
eg:
#include <stdio.h>
#include <sys/types.h>
#include <signal.h>
int main(int argc, char *argv[])
{
//kill(atoi(argv[1]), 9);
kill(atoi(argv[1]), SIGKILL); //给指定进程发送指定的信号
raise(9); //给自己发送信号
while (1);
return 0;
}
pause函数使调用进程挂起直至捕捉到一个信号。
#include <unistd.h>
int pause(void)
只有执行了一个信号处理函数后,挂起才结束
当系统捕捉到某个信号时,可以忽略该信号或是使用指定的处理函数来处理该信号,或者使用系统默认的方式
信号处理的主要方法有两种:
一种是使用简单的signal函数, 另一种是使用信号集函数组
include <stdio.h>
#include <signal.h>
void print(int sig)
{
printf("this is %d\n", sig);
}
void handler(int sig)
{
printf("this is %d\n", sig);
alarm(2);
}
int main()
{
//signal(2, SIG_IGN);
signal(SIGINT, SIG_IGN); //如果进程收到SIGINT信号,则忽略
signal(SIGKILL, SIG_IGN); //不能忽略
signal(SIGHUP, print);
signal(SIGALRM, handler);
alarm(2); //2秒钟之后,给进程发送SIGALRM信号 有效期一次
while (1);
return 0;
}
#include <signal.h>
signal(int signum, sighandler_t handler))
handler:
SIG_IGN:忽略此信号
SIG_DFL: 按系统默认方式处理
每个进程只能有一个闹钟时间.如果在调用alarm时,以前已为该进程设置过闹钟时间,而且它还没有超时,以前登记的闹钟时间则被新值代换
如果有以前登记的尚未超过的闹钟时间,而这次seconds值是0,则表示取消以前的闹钟
Linux中相关的命令
ps -elf 查看全部进程
ps -elf | grep xxxx 搜索有xxxx名字的进程
Ctrl键加Z 把进程切换到后台运行
./xxx & 在后台运行
fg 从前台切换到后台
which 命令 (查看路径)