操作系统复习

一.操作系统
1.进程与线程的区别?
一个进程由PCB(进程控制块)、数据段、代码段组成,进程本身不可以运行程序,而是像一个容器一样,先创建出一个主线程,分配给主线程一定的系统资源,这时候就可以在主线程开始实现各种功能。当我们需要实现更复杂的功能时,可以在主线程里创建多个子线程,跟人多好干活的道理一样,多个线程在同一个进程里,利用这个进程所拥有的系统资源合作完成某些功能。进程之间是相互独立的,

2.同一进程的多线程中哪些是独有的,哪些的共享的?
独有:栈(但没有保护机制,只要栈上的指针被别的线程拿到,就可被修改)、局部变量、寄存器、进程号PID、不同的父进程号、自 己的文件描述符
共享:除了独有的其他进程资源都可共享,堆、代码区、全局变量、静态变量、动态链接库、文件等

3.多进程、多线程的特点
1.多进程更健壮,系统会给每个进程分配独立的系统资源;多线程比较脆弱,一个线程崩溃很可能影响到整个程序,因为多个线程是在一个进程里一起合作干活的。
2.进程性能大于线程,但创建多进程的系统花销远大于创建多线程。
3.多进程不适合大量数据的传递,更适合小数据或者密集数据的传送。多线程适合大量数据的传递。
4.可以通过增加CPU的数量来增加进程的数量,但增加不了线程的数量,线程数量由进程的空间资源和线程本身栈大小确定。
5.安全稳定选进程;快速频繁选线程。

4.多线程优缺点
优点:提高CPU的利用率,在多线程程序中,一个线程必须等待的时候,CPU可以运行其它的线程而不是等待。
缺点:线程越多占用内存也越多、解决竞用共享资源、需要CPU时间跟踪线程协调与管理。

5.进程间通信的方法
(1)管道(有名管道、无名管道)
管道先进先出,管道需要通过内核进行通信
有名管道是一个存在于硬盘上的文件,而无名管道是存在于内存中的特殊文件。
无名管道:半双工、无名管道只能用于具有公共祖先的两个进程
Int pipe(int fd[2]);当一个管道建立时,会创建两个文件文件描述符,通过read write函数对文件描述符进行读写,要关闭管道只需将这两个文件描述符关闭即可。
一个多进程间管道读写通信的例子
在这里插入图片描述
有名管道:以FIFO的文件形式存储于文件系统中,只要可以访问该路径,就能够通过FIFO相互通信,可用于互不相关的两个进程间通信
调用open打开有名管道的进程可能会被阻塞。但如果同时用读写方式(O_RDWR)打开,则一定不会导致阻塞;如果以只读方式(O_RDONLY)打开,则调用open函数的进程将会被阻塞直到有写方式打开管道;同样以写方式(O_WRONLY)打开也会阻塞直到有读方式打开管道。
int mkfifo(const char* filename,mode_t mode)
一个有名管道读写的例子
https://blog.csdn.net/leafage_m/article/details/78893822

(2)信号量

sem_init()用来初始化一个信号量
sem_post( sem_t *sem )用来增加信号量的值
sem_wait( sem_t *sem )被用来阻塞当前线程直到信号量sem的值大于0,解除阻塞后将sem的值减一,表明公共资源经使用后减少。
sem_destroy(sem_t *sem)用来释放信号量sem

1.信号量是一个计数器,信号量用于实现进程间的互斥与同步,锁机制
2.信号量基于操作系统的PV操作,程序对信号量的操作都是原子操作,执行一次P操作其实就是意味申请一个p资源,S-1,当信号值小于0时,该进程进入阻塞队列;执行一次V操作其实就是意味释放一个资源,S+1,当信号值小于0时,释放阻塞队列中第一个等待信号量的进程;一个进程中PV操作必须成对出现。
pv操作的理解:https://blog.csdn.net/xizi_ghq/article/details/103621530
3.信号量(semaphore)的数据结构为一个值和一个指针,指针指向等待该信号量的下一个进程,当它的值大于0时,表示当前可用资源的数量;当它的值小于0时,其绝对值表示等待使用该资源的进程个数。

(3)共享内存
1.共享内存是最快的一种进程通信方式,直接通过虚拟地址访问物理内存,不通过内核,两个进程可以直接共享访问同一块内存区域,通常通过信号量来实现同步与互斥。
shmget ( ):创建共享内存
shmat ( ):挂接共享内存
shmdt ( ):去关联共享内存
shmctl ( ):销毁共享内存
2.共享内存demo:
https://blog.csdn.net/u011866460/article/details/46754591

(4)消息队列
1.本质原理:在操作系统内核中创建了一个优先级队列,多个进程间通过向队列中添加数据块或者获取数据块实现数据通信
2.struct msgbuf{type;data}这个结构体由用户自己定义,因为操作系统无法决定数据长度。
3.消息队列提供了一种从一个进程向另一个进程发送一个数据块的方法。而且,每个数据块被认为含有一个类型,接收进程可以独立地接收含有不同类型值的数据块。
(6)socket
服务器和客户端通过socket进行交互。服务器需要绑定在本机的某个端口号上,客户端需要声明自己连接哪个地址的哪个端口,这样服务器和客户端就能连接了。

6.线程间同步
(1)信号量(2)读写锁(3)条件变量(4)互斥锁(5)自旋锁

7.fork()函数的作用
https://www.cnblogs.com/love-jelly-pig/p/8471206.html
(fork高阶用法,还未看)
fork后中出现两个基本完全相同的进程,这两个进程执行没有固定的先后顺序,哪个进程先执行要看系统的进程调度策略。
两个进程都执行接下来的全部代码
1)在父进程中,fork返回新创建子进程的进程ID;
2)在子进程中,fork返回0;
3)如果出现错误,fork返回一个负值;

8.静态变量有什么性质?
当只有一个源文件时,静态变量与全局变量没有区别,若程序由多个源文件构成时,全局变量与全局静态变量不同:全局静态变量使得该变量成为定义该变量的源文件所独享.
静态全局变量的作用:
(1)不必担心其它源文件使用相同变量名,彼此相互独立。
(2)在某源文件中定义的静态全局变量不能被其他源文件使用或修改。所以不作为接口的函数一般用static修饰
(3)如果作为static局部变量在函数内定义,它的生存期为整个源程序,但是其作用域仍与自动变量相同,只能在定义该变量的函数内使用该变量。退出该函数后, 尽管该变量还继续存 在,但不能使用它。
(4) 静态变量默认初始化为0

9.一个进程都有哪些状态?
在这里插入图片描述
我们从父进程调用fork()创建子进程开始讲起,此时子进程处于创建态,此时系统为进程分配地址和资源后将进程加入就绪队列,进入就绪态。就绪态的进程得到CPU时间片调度正式运行,进入执行态。执行态有四种常见结果:
1)当时间片耗光或者被其他进程抢占,则重新进入就绪态,等待下一次CPU时间片;
2)由于某些资源暂时不可得到而进入“睡眠态”(如欲读取的文件为空或者欲获得的某个锁还处于不可获得状态),等待资源可得后再唤醒,唤醒后进入就绪态;
3)收到SIGSTOP/SIGTSTP信号进入暂停态,直到收到SIGCONT信号重新进入就绪态;
4)进程执行结束,通过内核调用do_exit()进入僵尸态,等待系统回收资源。当父进程调用wait()/waitpid()后接收结束子进程,该进程进入死亡态。

10.进程的上下文和中断上下文
我将其理解为保存用户空间状态是上文,切换后在内核态执行的程序是下文
所谓的进程上下文,就是一个进程在执行的时候,CPU的所有寄存器中的值、进程的状态以及堆栈中的内容,当内核需要切换到另一个进程时,它需要保存当前进程的所有状态,即保存当前进程的进程上下文,以便再次执行该进程时,能够恢复切换时的状态,继续执行。
中断上下文就可以理解为硬件传递过来的这些参数和内核需要保存的一些环境,主要是被中断的进程的环境。
运行于进程上下文的内核代码是可抢占的,但中断上下文则会一直运行至结束,不会被抢占。
中断期间不可以睡眠,这个时候不能睡眠的关键是因为上下文。
操作系统以进程调度为单位,进程的运行在进程的上下文中,以进程描述符作为管理的数据结构。进程可以睡眠的原因是操作系统可以切换不同进程的上下文,进行调度操作,这些操作都以进程描述符为支持。
中断运行在中断上下文,没有一个所谓的中断描述符来描述它,它不是操作系统调度的单位。一旦在中断上下文中睡眠,首先无法切换上下文(因为没有中断描述符,当前上下文的状态得不到保存),其次,没有人来唤醒它,因为它不是操作系统的调度单位。
Linux是以进程为调度单位的,调度器只看到进程内核栈,而看不到中断栈。在独立中断栈的模式下,如果linux内核在中断路径内发生了调度(从技术上讲,睡眠和调度是一个意思),那么linux将无法找到“回家的路”,未执行完的中断处理代码将再也无法获得执行机会。
此外,中断的发生是非常非常频繁的,在一个中断睡眠期间,其它中断发生并睡眠了,那很容易就造成中断栈溢出导致系统崩溃。
11.死锁
原因:
(1) 因为系统资源不足。
(2) 进程运行推进的顺序不合适。
(3) 资源分配不当等。
条件:
(1) 互斥条件:一个资源每次只能被一个进程使用。
(2) 请求与保持条件:一个进程因请求资源而阻塞时,对已获得的资源保持不放。
(3) 不剥夺条件:进程已获得的资源,在末使用完之前,不能强行剥夺。
(4) 循环等待条件:若干进程之间形成一种头尾相接的循环等待资源关系。

预防:
加锁顺序(线程按照一定的顺序加锁)
加锁时限(线程尝试获取锁的时候加上一定的时限,超过时限则放弃对该锁的请求,并释放自己占有的锁)
死锁检测

12.孤儿进程、僵尸进程、守护进程
孤儿进程:当父进程退出后它的子进程还在运行,那么这些子进程就是孤儿进程。孤儿进程将被init进程所收养,并由init进程对它们完成状态收集工作,当有孤儿进程需要处理的时候,系统就把孤儿进程的父进程设置为init,而init进程会循环地wait()它的已经退出的子进程。因此孤儿进程并不会有什么危害。
僵尸进程:当子进程退出后而父进程并未接收结束子进程(如调用waitpid获取子进程的状态信息),那么子进程仍停留在系统中,这就是僵尸进程,如果僵尸进程数量太多,那么就会导致系统空间爆满,无法创建新的进程
守护进程:是在后台运行不受终端控制的进程(如输入、输出等)。网络服务大部分就是守护进程。

13.同步、互斥、异步、同步阻塞、异步非阻塞
互斥:不能同时访问,且访问是无序的。
同步:不能同时访问,且访问是顺序的。
异步:不能同时访问,且访问是独立的。
同步阻塞:发送方发出请求后一直等待(同步),接收方开始读取文件,如果不能马上得到读取结果就一直等,直到获取读取结果再响应发送发,等待期间不可做其他操作(阻塞)。
异步非阻塞:发送方发出请求后,不等待响应,继续其他工作(异步),接收方读取文件如果不能马上得到结果,也不等待,而是马上返回取做其他事情。当IO操作(读取文件)完成以后,将完成状态和结果通知接收方,接收方在响应发送方。(效率最高)

14.常用io模型、io复用
https://zhuanlan.zhihu.com/p/115912936
五种io模型:阻塞io、非阻塞io(不断查询)、io复用(同时检测多个io)、信号驱动io(建立信号关联,等待信号通知)、异步io

io复用:利用系统函数select、poll、epoll同时监控多个io的fd,只要有数据状态准备就绪了,就会返回可读状态,此时再读取数据。

15.虚拟地址、物理地址
虚拟内存:虚拟内存是一种内存管理技术,它会使程序自己认为自己拥有一块很大且连续的内存,然而,这个程序在内存中不是连续的,并且有些还会在磁盘上,在需要时进行数据交换;

虚拟地址:也就是逻辑地址,是指由程序产生的与段相关的偏移地址部分。例如,你在进行C语言指针编程中,可以读取指针变量本身值(&操作),实际上这个值就是逻辑地址,虚拟地址空间是对于一个单一进程的概念,这个进程看到的将是地址从0000开始的整个内存空间。虚拟存储器是一个抽象概念,它为每一个进程提供了一个假象,好像每一个进程都在独占的使用主存。每个进程看到的存储器都是一致的,称为虚拟地址空间。虚拟地址最终映射到物理地址。

物理地址:物理地址就是内存单元的绝对地址

线性地址: 逻辑地址到物理地址变换之间的中间层

地址转换:第一阶段使用分段机制把程序的逻辑地址变换成处理器可寻址内存空间(称为线性地址空间)中的地址。第二阶段的分页机制把线性地址转换成物理地址。第一阶段的分段变换机制是必须使用的,但是第二阶段的分页机制是可选择的。如果没有开启分页机制,那么分段机制产生的线性地址空间就直接映射到处理器的物理地址空间上。

16.扇区 块 页 簇 内零头 外零头 硬链接 软链接
扇区:是磁盘中最小的物理存储单位,硬盘的读写以扇区为基本单位。

块:是操作系统最小的逻辑存储单位

页:内存的最小存储单位,操作系统与内存打交道的最小单位为页

内零头:系统给进程分配内存,额外分配的一些内存,别的内存无法访问。

外零头:内存中的一些空闲的内存区域,但因为太小无法满足其他进程申请的内存大小而形成的

页式存储管理:是以页为单位(页面的大小由系统确定,且大小是固定的)向进程分配内存的.会出现内零头

段式存储管理:是段(段的大小是程序逻辑确定,且大小不是固定的)为单位向进程进行内存分配的,进程申请多少内存,系统就给进程分配多少内存,这样就不会产生内零头,但是段式分配会产生外零头。

链接操作实际上是给系统中已有的某个文件指定另外一个可用于访问它的名称
硬链接:硬链接实际上是为文件建一个别名,链接文件和原文件实际上是同一个文件,不可以跨越文件系统,
软链接:连接产生的是一个新的文件,但这个文件的作用就是专门指向某个文件的,可以跨越文件系统

硬连接不管有多少个,都指向的是同一个I节点,会把结点连接数增加,只有符号链接才产生新的inode节点,只要结点的连接数不是0,文件就一直存在不管你删除的是源文件还是连接的文件。只要有一个存在文件就存在。

软链接不直接使用i节点号作为文件指针, 而是使用文件路径名作为指针。所以删除连接文件对源文件无影响,但是删除源文件,连接文件就会找不到要指向的文件。软链接有自己的inode, 并在磁盘上有一小片空间存放路径名。

17.中断与异常

中断
外中断:io设备,其他硬件部件,
内中断:就是异常,是指由于 CPU 内部事件所引起的中断,如程序出错(非法指令、地址越界)。

中断的处理流程:
请求中断→响应中断→关闭中断→保留断点→中断源识别→保护现场→中断服务子程序→恢复现场→中断返回。

18.大小端

  1. 小端模式 : 就是低位字节排放在内存的低地址端,高位字节排放在内存的高地址端。
  2. 大端模式:是高位字节排放在内存的低地址端,低位字节排放在内存的高地址端。

1)Interl x86系列芯片使用小端存储模式,ARM的芯片默认小端,但可以切换到大端;
2)网络上普遍采用大端模式,使用大端的CPU: power pc 、DSP … …51
3)大小端是由CPU架构决定的, 不是软件决定!!!

内存的最小单位是字节(byte),占8bit

**19.**union的理解
整个联合体的大小由最大的成员决定。
在这里插入图片描述
20.gcc编译的过程
1)预处理(Pre-Processing)
引入头文件、替换宏、去除注释等预处理命令

2)编译(Compiling)
生成汇编代码,生成.obj文件

3)汇编(Assembling)
将汇编代码转换成二进制文件

4)链接(Linking)
链接一些库和一些函数和变量。

静态链接.a,将库文件代码放在可执行文件中
动态链接:.so,执行时转换到库文件执行

堆栈:
栈是向低地址扩展的是一段连续的内存区域,无需手动释放。
堆是向高地址扩展的是不连续的内存区域,效率比栈低。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值