1、程序、进程和并发
(1)程序
程序,是指编译好的二进制文件,在磁盘上,不占用系统资源(cpu、内存、打开的文件、设备、锁....)
(2)进程
是一个抽象的概念,与操作系统原理联系紧密。进程是活跃的程序,占用系统资源。在内存中执行。(程序运行起来,产生一个进程)
(3)并发
在操作系统中,一个时间段中有多个进程都处于已启动运行到运行完毕之间的状态。但,任一个时刻点上仍只有一个进程在运行。
2、单道程序设计和多道程序设计
(1)单道程序设计
所有进程一个一个排对执行。若A阻塞,B只能等待,即使CPU处于空闲状态。而在人机交互时阻塞的出现时必然的。所有这种模型在系统资源利用上及其不合理,在计算机发展历史上存在不久,大部分便被淘汰了。
(2)多道程序设计
在计算机内存中同时存放几道相互独立的程序,它们在管理程序控制之下,相互穿插的运行。多道程序设计必须有硬件基础作为保证。
(3)时钟中断
时钟中断即为多道程序设计模型的理论基础。 并发时,任意进程在执行期间都不希望放弃cpu。因此系统需要一种强制让进程让出cpu资源的手段。时钟中断有硬件基础作为保障,对进程而言不可抗拒。 操作系统中的中断处理函数,来负责调度程序执行。
(4)注意说明
在多道程序设计模型中,多个进程轮流使用CPU (分时复用CPU资源)。而当下常见CPU为纳秒级,1秒可以执行大约10亿条指令。由于人眼的反应速度是毫秒级,所以看似同时在运行。
3、CPU和MMU
(1)CPU
(1)寄存器
寄存器是中央处理器内的组成部分。寄存器是有限存贮容量的高速存贮部件,它们可用来暂存指令、数据和地址。在中央处理器的控制部件中,包含的寄存器有指令寄存器(IR)和程序计数器(PC)。在中央处理器的算术及逻辑部件中,寄存器有累加器(ACC)。
(2)程序计数器
程序计数器是计算机处理器中的寄存器,它包含当前正在执行的指令的地址(位置)。当每个指令被获取,程序计数器的存储地址加一。在每个指令被获取之后,程序计数器指向顺序中的下一个指令。当计算机重启或复位时,程序计数器通常恢复到零。
(3)译码器
译码器是一类多输入多输出组合逻辑电路器件,其可以分为:变量译码和显示译码两类。 变量译码器一般是一种较少输入变为较多输出的器件,常见的有n线-2^n线译码和8421BCD码译码两类;显示译码器用来将二进制数转换成对应的七段码,一般其可分为驱动LED和驱动LCD两类。
(4)算数逻辑单元(ALU)
算术逻辑单元是中央处理器(CPU)的执行单元,是所有中央处理器的核心组成部分,由与门和或门构成的算术逻辑单元,主要功能是进行二位元的算术运算,如加减乘(不包括整数除法)。基本上,在所有现代CPU体系结构中,二进制都以补码的形式来表示。
(5)MMU
1| MMU是Memory Management Unit的缩写,中文名是内存管理单元,它是中央处理器(CPU)中用来管理虚拟存储器、物理存储器的控制线路,同时也负责虚拟地址映射为物理地址,以及提供硬件机制的内存访问授权,多用户多进程操作系统。
2| 特点
<1> 虚拟内存与物理内存的映射
<2> 设置修改内存访问级别
(2)MMU
4、进程控制块PCB
(1)进程id
系统中每个进程有唯一的id,在C语言中用pid_t类型表示,其实就是一个非负整数。
(2)进程的状态
有就绪、运行、挂起、停止等状态。
(3)进程切换时需要保存和恢复的一些CPU寄存器。
(4)描述虚拟地址空间的信息和描述控制终端的信息。
(5)进程基本的状态有5种。分别为初始态,就绪态,运行态,挂起态与终止态。其中初始态为进程准备阶段,常与就绪态结合来看。
5、环境变量
(1)环境变量简介
环境变量是指在操作系统中用来指定操作系统运行环境的一些参数。
(2)环境变量特征
1| 字符串(本质)
2| 有统一的格式:名=值[:值]
3| 值用来描述进程环境信息。
(4)存储形式
与命令行参数类似。char *[]数组,数组名environ,内部存储字符串,NULL作为哨兵结尾。
(5)使用形式
与命令行参数类似。
(6)加载位置
与命令行参数类似。位于用户区,高于stack的起始位置。
(7)引入环境变量表
须声明环境变量。extern char ** environ;
(8)打印当前进程的所有环境变量
#include <stdio.h>
extern char ** environ;
int main(void)
{
int i;
for(i=0;environ[i];i++)
{
printf("%s\n",environ[i]);
}
return 0;
}
6、环境变量操作函数
(1)getenv函数
1| 作用:获取环境变量值
2| 函数原型: char *getenv(const char *name);
3| 返回值:
如果成功,则返回环境变量的值
如果失败,则返回NULL (name不存在)
(2)setenv函数
1| 作用:设置环境或者修改环境变量变量的值
2| 函数原型:int setenv(const char *name, const char *value, int overwrite);
3| 返回值:
成功:0;失败:-1
4| 参数overwrite取值
1:覆盖原环境变量
0:不覆盖。(该参数常用于设置新环境变量,如:ABC = haha-day-night)
(3)unsetenv函数
1| 作用:删除环境变量name的定义
2| 函数原型:int unsetenv(const char *name);
3| 返回值:
成功:0;失败:-1
7、创建单个子进程
(1)fork函数
1| 函数原型:pid_t fork(void)
2| 返回值(与普通的返回值不同,有两个返回值):
① 父进程返回子进程的id(大于0) —————— 返回子进程的id
② 子进程返回值为0 —————— 返回0
(2)循环创建n个子进程
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
int main()
{
int i;
pid_t pid;
printf("xxxxxxxxxxxxx\n");
for(i=0;i<5;i++)
{
pid = fork;
if(pid == -1)
{
perror("fork error");
exit(1);
}
else if(pid == 0)
{
break;
}
}
if(i<5)
{
sleep(i);
printf("I am %d child , pid = %u\n",i+1,getpid());
}
else
{
sleep(i);
printf("I am parent");
}
}
8、exec函数族
fork创建子进程后执行的是和父进程相同的程序(但有可能执行不同的代码分支),子进程往往要调用一种exec函数以执行另一个程序。当进程调用一种exec函数时,该进程的用户空间代码和数据完全被新程序替换,从新程序的启动例程开始执行。调用exec并不创建新进程,所以调用exec前后该进程的id并未改变。
将当前进程的.text、.data替换为所要加载的程序的.text、.data,然后让进程从新的.text第一条指令开始执行,但进程ID不变,换核不换壳。
其实有六种以exec开头的函数,统称exec函数:
int execl(const char *path, const char *arg, ...);
int execlp(const char *file, const char *arg, ...);
int execle(const char *path, const char *arg, ..., char *const envp[]);
int execv(const char *path, char *const argv[]);
int execvp(const char *file, char *const argv[]);
int execve(const char *path, char *const argv[], char *const envp[]);
(1)execlp函数
1| 函数原型:int execlp(const char *file, const char *arg, ...);
2| 作用:加载一个进程,借助PATH环境变量
3| 返回值:成功:无返回;失败:-1
4| const char *file:表示要加载的程序的名字。
5| 该函数通常用来调用系统程序。如:ls、date、cp、cat等命令。
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
int main()
{
pid_t pid;
pid = fork;
if(pid == -1)
{
perror("fork error");
exit(1);
}
else if(pid > 0)
{
sleep(2);
printf("parent\n");
}
else
{
execlp("ls","ls","-l","-a",NULL);
}
return 0;
}
(2)execl函数
1| 函数原型: int execl(const char *path, const char *arg, ...);
2| 作用:加载一个进程, 通过 路径+程序名 来加载。
3| 返回值:成功:无返回;失败:-1
4| 对比execlp,如加载"ls"命令带有-l,-F参数
execlp("ls", "ls", "-l", "-F", NULL); 使用程序名在PATH中搜索。
execl("/bin/ls", "ls", "-l", "-F", NULL); 使用参数1给出的绝对路径搜索。
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
int main()
{
pid_t pid;
pid = fork;
if(pid == -1)
{
perror("fork error");
exit(1);
}
else if(pid > 0)
{
sleep(2);
printf("parent\n");
}
else
{
execlp("/bin/ls","ls","-l","-a",NULL);
}
return 0;
}
9、僵尸进程和孤儿进程
(1)孤儿进程
孤儿进程: 父进程先于子进程结束,则子进程成为孤儿进程,子进程的父进程成为init进程,称为init进程领养孤儿进程。
(2)僵尸进程
僵尸进程: 进程终止,父进程尚未回收,子进程残留资源(PCB)存放于内核中,变成僵尸(Zombie)进程。
(2)特别注意
僵尸进程是不能使用kill命令清除掉的。因为kill命令只是用来终止进程的,而僵尸进程已经终止。
10、wait回收子进程 ——只能回收一个子进程
(1)函数原型
pid_t wait(int *status);
(2)返回值
成功:返回清理掉的子进程ID 失败:返回-1(没有子进程)
(3)作用
1| 阻塞等待子进程
2| 回收子进程资源
3| 获取子进程结束状态
(4)其他注意
可使用wait函数传出参数status来保存进程的退出状态。借助宏函数来进一步判断进程终止的具体原因。宏函数可分为如下三组:
1. WIFEXITED(status) 为非0 → 进程正常结束
WEXITSTATUS(status) 如上宏为真,使用此宏 → 获取进程退出状态 (exit的参数)
2. WIFSIGNALED(status) 为非0 → 进程异常终止
WTERMSIG(status) 如上宏为真,使用此宏 → 取得使进程终止的那个信号的编号。
*3. WIFSTOPPED(status) 为非0 → 进程处于暂停状态
WSTOPSIG(status) 如上宏为真,使用此宏 → 取得使进程暂停的那个信号的编号。
WIFCONTINUED(status) 为真 → 进程暂停后已经继续运行
(5)有关代码
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/wait.h>
int main()
{
pid_t pid,wpid;
int status;
pid = fork();
if(pid == 0)
{
printf("----child,my parent = %d,going to sleep 3s\n",getppid());
sleep(3);
printf("-----------------child die---------------");
return 100;
}
else if(pid >0)
{
wpid = wait(&status);
if(wpid == -1)
{
perror("wait error:");
exit(1);
}
if(WIFEXITED(status)!=0)
{
printf("child exit with %d\n",WEXITSTATUS(status));
}
if(WIFSIGNALED(status)!=0)
{
printf("child killed by %d\n",WTERMSIG(status));
}
}
while(1)
{
printf("I am parent,pid = %d,myson = %d\n",getpid(),pid);
sleep(1);
}
}
11、waitpid回收子进程
(1)函数原型
pid_t waitpid(pid_t pid, int *status, in options);
(2)有关参数
1| pid_t pid:指定回收进程的ID
2| int *status:回收进程退出状态
3| in options:0或者WNOHANG
(3)返回值
成功:返回清理掉的子进程ID; 失败:-1(无子进程)
返回0值:参3为WNOHANG,且子进程正在运行
(4)参数
1| 参数1:
pid > 0 表示指定进程ID回收 pid = 0 表示回收本组任意子进程
pid = -1 表示回收任意子进程 pid < -1 表示回收改进程组的任意子进程
2| 参数2:
status
3| 参数3:
0 代表(wait)阻塞回收 WNOHANG:非阻塞回收(轮询)
(5)有关代码
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <sys/wait.h>
int main(int argc,char *argv[])
{
int n=5,i;
pid_t p,q;
pid_t wpid;
if(argc == 2)
{
n = atoi(argv[1]);
}
for(i=0;i<n;i++)
{
p = fork();
if(p == 0)
{
break;
}
else if(i == 3)
{
q = p;
}
}
if(n==i)
{
sleep(n);
printf("I am parent,pid = %d\n",getpid());
waitpid(q,NULL,0);
while(1);
}
else
{
sleep(i);
printf("I am %dth child,pid = %d,gpid = %d\n",i+1,getpid(),getgid());
while(1);
}
return 0;
}
12、管道
(1)概念
管道是一种最基本的IPC机制,作用于有血缘关系的进程之间,完成数据传递。调用pipe系统函数即可创建一个管道。
(2)特征
1| 其本质是一个伪文件(实为内核缓冲区)
2| 由两个文件描述符引用,一个表示读端,一个表示写端。
3| 规定数据从管道的写端流入管道,从读端流出。
(3)原理和局限性
1| 原理
管道实为内核使用环形队列机制,借助内核缓冲区(4k)实现。
2| 局限性
<1> 数据自己读不能自己写。
<2> 数据一旦被读走,便不在管道中存在,不可反复读取。
<3> 由于管道采用半双工通信方式。因此,数据只能在一个方向上流动。
<4> 只能在有公共祖先的进程间使用管道。
3| 常见的通信方式有,单工通信、半双工通信、全双工通信。
14、pipe函数
(1)函数原型
int pipe(int pipefd[2]);
(2)返回值
成功:0 失败:-1 设置:errmo
(3)使用说明
函数调用成功返回r/w两个文件描述符。无需open,但需手动close。规定:fd[0] → r; fd[1] → w,就像0对应标准输入,1对应标准输出一样。向管道文件读写数据其实是在读写内核缓冲区。
1| 父进程调用pipe函数创建管道,得到两个文件描述符fd[0]、fd[1]指向管道的读端和写端。
2| 父进程调用fork创建子进程,那么子进程也有两个文件描述符指向同一管道。
3| 父进程关闭管道读端,子进程关闭管道写端。父进程可以向管道中写入数据,子进程将管道中的数据读出。由于管道是利用环形队列实现的,数据从写端流入管道,从读端流出,这样就实现了进程间通信。
#include <unistd.h>
#include <string.h>
#include <stdlib.h>
#include <stdio.h>
#include <sys/wait.h>
void sys_err(const char *str)
{
perror(str);
exit(1);
}
int main(void)
{
pid_t pid;
char buf[1024];
int fd[2];
char *p = "test for pipe\n";
if (pipe(fd) == -1)
sys_err("pipe");
pid = fork();
if (pid < 0) {
sys_err("fork err");
} else if (pid == 0) {
close(fd[1]);
int len = read(fd[0], buf, sizeof(buf));
write(STDOUT_FILENO, buf, len);
close(fd[0]);
} else {
close(fd[0]);
write(fd[1], p, strlen(p));
wait(NULL);
close(fd[1]);
}
return 0;
}
(4)管道的优劣
1| 优点:简单,相比信号,套接字实现进程间通信,简单很多。
2| 缺点:
<1> 只能单向通信,双向通信需建立两个管道。
<2> 只能用于父子、兄弟进程(有共同祖先)间通信。该问题后来使用fifo有名管道解决。
15、mmap函数
(1)作用
创建共享内存
(2)函数原型
void *mmap(void *adrr, size_t length, int prot, int flags, int fd, off_t offset);
(3)参数说明
1| addr: 建立映射区的首地址,由Linux内核指定。使用时,直接传递NULL
2| length: 欲创建映射区的大小
3| prot: 映射区权限PROT_READ、PROT_WRITE、PROT_READ|PROT_WRITE
4| flags: 标志位参数(常用于设定更新物理区域、设置共享、创建匿名映射区)
MAP_SHARED: 会将映射区所做的操作反映到物理设备(磁盘)上。
MAP_PRIVATE: 映射区所做的修改不会反映到物理设备。
5| fd: 用来建立映射区的文件描述符
6| offset: 映射文件的偏移(4k的整数倍)
(4)返回值
成功:返回创建的映射区首地址 失败:MAP_FAILED宏
(5)mmap函数创建映射区
#include <stdio.h>
#include <stdlib.h>
#include <fcntl.h>
#include <unistd.h>
#include <string.h>
#include <sys/mman.h>
int main()
{
int len,ret;
char *p = NULL;
int fd = open("mytest.txt",O_CREAT|O_RDWR,0644);
if(fd == -1)
{
perror("open error:");
exit(1);
}
len = ftruncate(fd,4);
if(len == -1)
{
perror("ftruncate error:");
exit(1);
}
p = mmap(NULL,4,PROT_READ|PROT_WRITE,MAP_SHARED,fd,0);
if(p == MAP_FAILED)
{
perror("mmap error:");
exit(1);
}
strcpy(p,"abc");
ret = munmap(p,4);
if(ret == -1)
{
perror("munmap error:");
exit(1);
}
close(fd);
return 0;
}
(6)mmap函数注意事项
1| 创建映射区的过程中,隐含着一次对映射文件的读操作。
2| 当MAP_SHARED时,要求:映射区的权限应 <=文件打开的权限(出于对映射区的保护)。而MAP_PRIVATE则无所谓,因为mmap中的权限是对内存的限制。
3| 映射区的释放与文件关闭无关。只要映射建立成功,文件可以立即关闭。
4| 特别注意,当映射文件大小为0时,不能创建映射区。所以:用于映射的文件必须要有实际大小!! mmap使用时常常会出现总线错误,通常是由于共享文件存储空间大小引起的。
5| munmap传入的地址一定是mmap的返回地址。坚决杜绝指针++操作。
6| 文件偏移量必须为4K的整数倍
7| mmap创建映射区出错概率非常高,一定要检查返回值,确保映射区建立成功再进行后续操作。
16、mmap父子进程间的通信
父子等有血缘关系的进程之间也可以通过mmap建立的映射区来完成数据通信。但相应的要在创建映射区的时候指定对应的标志位参数flags:
MAP_PRIVATE: (私有映射) 父子进程各自独占映射区;
MAP_SHARED: (共享映射) 父子进程共享映射区;
结论:父子进程共享:1. 打开的文件 2. mmap建立的映射区(但必须要使用MAP_SHARED)
17、匿名映射区
(1)作用
无需依赖文件创建映射区
(2)方法1
int *p = mmap(NULL,4,PROT_READ|PROT_WRITE,MAP_SHARED|MAP_ANON,-1,0);
新增参数:MAP_ANON "4":随意举例,根据实际情况来确定大小
#include <stdio.h>
#include <stdlib.h>
#include <fcntl.h>
#include <unistd.h>
#include <string.h>
#include <sys/mman.h>
int main()
{
int ret;
char *p = NULL;
p = mmap(NULL,4,PROT_READ|PROT_WRITE,MAP_SHARED|MAP_ANON,-1,0);
if(p == MAP_FAILED)
{
perror("mmap error:");
exit(1);
}
strcpy(p,"abc");
ret = munmap(p,4);
if(ret == -1)
{
perror("munmap error:");
exit(1);
}
close(fd);
return 0;
}
(3)方法2
fd = open(“/dev/zero”,O_RDWR); —————— 创建伪文件
int *p = mmap(NULL,4,PROT_READ|PROT_WRITE,MAP_SHARED,fd,0);
#include <stdio.h>
#include <stdlib.h>
#include <fcntl.h>
#include <unistd.h>
#include <string.h>
#include <sys/mman.h>
int main()
{
int len,ret;
char *p = NULL;
int fd = open("/dev/zero",O_RDWR);
if(fd == -1)
{
perror("open error:");
exit(1);
}
len = ftruncate(fd,4);
if(len == -1)
{
perror("ftruncate error:");
exit(1);
}
p = mmap(NULL,4,PROT_READ|PROT_WRITE,MAP_SHARED,fd,0);
if(p == MAP_FAILED)
{
perror("mmap error:");
exit(1);
}
strcpy(p,"abc");
ret = munmap(p,4);
if(ret == -1)
{
perror("munmap error:");
exit(1);
}
close(fd);
return 0;
}
18、非血缘关系进程间mmap通信
(1)编写一个程序进行读操作
#include <stdio.h>
#include <sys/stat.h>
#include <sys/types.h>
#include <fcntl.h>
#include <unistd.h>
#include <stdlib.h>
#include <sys/mman.h>
#include <string.h>
struct STU{
int id;
char name[20];
char sex;
};
int main(int argc,char *argv[])
{
int fd;
struct STU student;
struct STU *mm;
if(argc < 2)
{
printf("./a.out file_shared\n");
exit(1);
}
fd = open(argv[1],O_RDONLY);
if(fd == -1)
{
perror("open error:");
exit(1);
}
mm = mmap(NULL,sizeof(student),PROT_READ,MAP_SHARED,fd,0);
if(mm == MAP_FAILED)
{
perror("mmap error:");
exit(1);
}
close(fd);
while(1)
{
printf("id = %d\tname = %s\t%c\n",mm->id,mm->name,mm->sex);
}
munmap(mm,sizeof(student));
return 0;
}
(2)编写一个程序进行写操作
#include <stdio.h>
#include <sys/stat.h>
#include <sys/types.h>
#include <fcntl.h>
#include <unistd.h>
#include <stdlib.h>
#include <sys/mman.h>
#include <string.h>
struct STU{
int id;
char name[20];
char sex;
};
int main(int argc,char *argv[])
{
int fd;
struct STU student = {10,"xiaoming",'m'};
char *mm;
if(argc < 2)
{
printf("./a.out file_shared\n");
exit(1);
}
fd = open(argv[1],O_RDWR|O_CREAT,0644);
if(fd == -1)
{
perror("open error:");
exit(1);
}
ftruncate(fd,sizeof(student));
mm = mmap(NULL,sizeof(student),PROT_READ,MAP_SHARED,fd,0);
if(mm == MAP_FAILED)
{
perror("mmap error:");
exit(1);
}
close(fd);
while(1)
{
memcpy(mm,&student,sizeof(student));
student.id++;
sleep(1);
}
munmap(mm,sizeof(student));
return 0;
}