【学习日记】操作系统-入门知识-个人学习记录

我的学习笔记链接:
MyLinuxProgramming

参考资料

操作系统概念

  • 特点

    • 并发
    • 共享
    • 虚拟
    • 异步
  • Linux

    • 多任务、SMP对称多处理、ELF可执行文件、宏内核
  • Windows

    • NT、PE可执行文件、混合型内核

进程与线程

-进程

  • 进程的状态

    • 运行台 就绪态 阻塞态(等待态) 创建态 终止态
      请添加图片描述
  • 进程控制块 PCB

    • PCB 是进程存在的唯一标志
  • 并发:交替进行

  • 并行:同时进行 --流水线

-线程

  • 线程间可以并发运行且共享相同的地址空间

  • 进程中一个线程崩溃,其他线程都崩溃

  • 线程是调度的基本单位,进程是资源拥有的基本单位

  • 线程的实现

    • 用户线程的整个线程管理和调度,操作系统不直接参与
    • 用户级线程库函数来完成线程的管理,包括线程的创建、终止、同步和调度等
    • 内核线程由操作系统管理程对应的TCB放在操作系统
    • 内核线程的创建、终止和管理都由操作系统负责
    • 轻量级线程 LWP

-进程调度算法

  • 需要考虑的因素

    • CPU利用率
    • 吞吐量。长作业会降低吞吐量
    • 周转时间。进程运行和阻塞时间的总和
    • 等待时间。进程处于就绪队列的时间
    • 响应时间。交互式系统中衡量调度算法的主要标准
  • FCFS 先来先服务调度算法

    • 不可剥夺
    • 效率低,适用于CPU繁忙型作业
    • 对长作业有利,对短作业不利
  • SJF 短作业优先调度算法

    • 对短作业有利
    • 相比FCFS降低了平均周转时间
    • 可能会导致长作业“饥饿”现象
  • 优先级调度算法

    • 分为非抢占式和抢占式
    • 优先级设置规则:
      • 系统进程>用户进程 交互型>非交互型 I/O型>计算型
  • RR 时间片轮转调度算法

    • 适用于分时系统,提高交互体验
    • 选择适当的时间片很重要
  • MLFQ 多级反馈队列调度算法
    请添加图片描述

    • 动态调整优先级和时间片大小
    • 多个就绪队列,每个队列不同优先级
    • 每个队列进程运行时间片不同
    • 每个队列采用FCFS算法
    • 按队列优先级调度
    • 优点:短作业优先,周转时间短,长作业不会饿死

-协程

  • 是一种比线程更加轻量级的存在
  • 正如一个进程可以拥有多个线程一样,一个线程也可以拥有多个协程
  • 协程不被操作系统内核所管理,而是完全由程序所控制(也就是在用户态执行)
  • 协程的优点是性能得到了很大的提升,不像线程切换那样消耗资源

进程间通信 IPC

-管道

  • 管道是内核中的一串缓存,无格式且大小受限

  • 一次性操作,只支持半双工

  • 生产者消费者模式

  • 匿名管道。Linux命令行中的 “|”

    • 只能用于父子关系的进程间通信
  • 命名管道。FIFO

    mkfifo myPipe
    echo "hello" > myPipe
    cat < myPipe
    

请添加图片描述

-消息队列

  • 消息队列是内核中的消息链表
  • 不适合大数据传输

-共享内存

  • 共享内存的机制是拿出一块虚拟地址空间,映射到相同的物理内存中

-信号量

  • 信号量是一个整型的计数器
  • 用于实现进程间的互斥与同步
  • P、V 操作
    • P操作使得信号量减1
    • V操作使得信号量加1

-信号

  • 可参考APUE第10章
  • 唯一的异步通信机制
  • 两种无法捕捉和忽略的信号:SIGKILL、SEGSTOP

-Socket

int socket(int domain, int type, int protocal) 
  • 字节流SOCKSTREAM、数据包SOCKDGRAM

  • 基于TCP协议的通信示例:

请添加图片描述

  • 1.服务端和客户端初始化socket,得到文件描述符
  • 2.服务端调用bind,绑定IP和端口
  • 3.服务端调用listen,开始监听
  • 4.服务端调用accept,等待客户端连接
  • 5.客户端调用connect,向服务端IP和端口发起连接请求
  • 6.服务端调用accept,返回用于传输的socket文件描述符
  • 7.客户端调用write写入数据
  • 8.服务端调用read读取数据
  • 9.客户端断开连接时,调用close,那么服务端read读取数据的时候,会读到EOF,待处理完数据后,服务端调用 close,表示连接关闭
  • 这里需要注意的是,服务端调用 accept 时,连接成功了会返回一个已完成连接的 socket,后续用来传输数据。

多线程同步

  • 多个线程如果竞争共享资源,如果不采取有效的措施,则会造成共享数据的混乱
  • 竞争条件。不确定性
  • 临界区

-互斥与同步

  • 同步举例:「操作 A 应在操作 B 之前执行」,「操作 C 必须在操作 A 和操作 B 都完成之后才能执行」等

  • 互斥举例:「操作 A 和操作 B 不能在同一时刻执行」

    • 原子操作指令 —— 测试和置位(Test-and-Set)
    int TestAndSet(int *old_ptr, int new)
    {
      int old = *old_ptr;
      *old_ptr = new;
      return old;
    }
    
    • 忙等待锁。也称为自旋锁
    • 无等待锁。
  • 信号量

    • P/V操作
    // 信号量数据结构
    type struct sem_t{
      int sem;  // 资源个数
      queue_t *q;  // 等待队列
    } sem_t;
    
    // 初始化信号量
    void init(sem_t *s, int sem)
    {
      s->sem = sem;
      queue_init(s->q);
    }
    
    // P操作
    void P(sem_t *s)
    {
      s->sem--;
      if(s->sem < 0)
      {
        // 1、保留调用线程CPU现场
        // 2、将该线程的TCB插入s的等待队列
        // 3、设置该线程为等待状态
        // 4、执行调度程序
      }
    }
        
    // V操作
    void V(sem_t *s)
    {
      s->sem++;
      if(s->sem <= 0)
      {
        // 1、移除s等待队列首元素
        // 2、将该线程的TCB插入就绪队列
        // 3、设置该线程为就绪状态
      }
    }
    
    • 对于两个并发线程,互斥信号量的值仅取 1、0 和 -1 三个值
    • 如果互斥信号量为 1,表示没有线程进入临界区
    • 如果互斥信号量为 0,表示有一个线程进入临界区
    • 如果互斥信号量为 -1,表示一个线程进入临界区,另一个线程等待进入
    • 通过互斥信号量的方式,能保证临界区任何时刻只有一个线程在执行,就达到了互斥的效果。

-生产者-消费者问题

  • 问题描述:

    • 生产者在生成数据后,放在一个缓冲区中
    • 消费者从缓冲区取出数据处理
    • 任何时刻,只能有一个生产者或消费者可以访问缓冲区
  • 互斥与同步的体现:

    • 任何时刻只能有一个线程操作缓冲区,操作缓冲区是临界代码,说明需要互斥
    • 缓冲区空时,消费者必须等待生产者生成数据;缓冲区满时,生产者必须等待消费者取出数据。说明需要同步
  • 需要三个信号量:

    • 互斥信号量 mutex:用于互斥访问缓冲区,初始化值为 1
    • 资源信号量 fullBuffers:用于消费者询问缓冲区是否有数据,有数据则读取数据,初始化值为 0(表明缓冲区一开始为空);
    • 资源信号量 emptyBuffers:用于生产者询问缓冲区是否有空位,有空位则生成数据,初始化值为 n (缓冲区大小)
    semaphore mutex = 1;
    semaphore empty = n;  // 空闲缓冲区大小
    semaphore full = 0;   // 缓冲区初始为空
    producer()
    {
      while(1)
      {
        生产数据...
        P(empty);
        P(mutex);
        把数据放入缓冲区...
        V(mutex);
        V(full);      
      }
    }
    consumer()
    {
      while(1)
      {
        P(full);
        P(mutex);
        从缓冲区中取出数据...
        V(mutex);
        V(empty);
        消费数据...      
      }
    }
    
    

-哲学家就餐问题

-读写者问题

-死锁

  • 死锁产生需同时满足的四个条件
    • 互斥
      请添加图片描述

    • 不剥夺
      请添加图片描述

    • 请求并保持
      请添加图片描述

    • 循环等待
      请添加图片描述

  • pstack <pid>显示每个线程的栈跟踪信息(函数调用过程)

-避免死锁

  • 破坏四个条件之一即可
  • 使用资源有序分配法,破坏环路等待条件
  • 死锁避免算法:银行家算法

-锁的种类

  • 加锁的目的是保证共享资源在任意时间里,只有一个线程访问,避免多线程导致共享数据错乱的问题

  • 互斥锁 [独占锁]

    • 加锁失败后,线程会释放CPU
      请添加图片描述
  • 自旋锁

    • 加锁失败后,线程会忙等待
    • 相对来说开销比互斥锁小一点
  • 读写锁

    • 适用于读多写少的场景
      请添加图片描述

    • 公平读写锁,防止饥饿问题

  • 悲观锁

    • 悲观锁认为多线程同时修改共享资源的概率比较高,于是很容易出现冲突,所以访问共享资源前先要上锁
  • 乐观锁

    • 如果多线程同时修改共享资源的概率比较低,就可以采用乐观锁
    • 乐观锁假定冲突的概率很低
    • 乐观锁的工作方式:
      • 先修改完共享资源,再验证这段时间内有没有发生冲突
      • 如果没有其他线程在修改资源,操作完成
      • 如果发现有其他线程已经修改过这个资源,放弃本次操作
    • 乐观锁的应用:在线文档多人编辑、Git、SVN

内存管理

-虚拟内存

  • 不同进程的虚拟地址和不同内存的物理地址映射

  • 虚拟地址(VA)—> 内存管理单元(MMU) —> [映射到]物理地址(PA)

  • 管理方式:内存分段和内存分页

  • 内存分段:

    • 段表:段号、段基地址、段界限
    • 问题:内存碎片、交换效率低
  • 内存分页

    • 把整个虚拟和物理内存空间分为若干页
    • 每一页4kb
    • 换出换入 swap out / swap in
      请添加图片描述
    • 页表:页号、页内偏移
    • 多级页表
      • 解决页表过大的问题
    • TLB-Translation Lookaside Buffer
      • 页表缓存,局部性原理
  • 段页式内存管理

    • 段号、段内页号和页内位移
    • 第一次访问段表,得到页表起始地址;
    • 第二次访问页表,得到物理页号;
    • 第三次将物理页号与页内位移组合,得到物理地址。
      请添加图片描述

-Linux内存管理

请添加图片描述

  • 程序文件段 .text
    • 包括二进制可执行代码
  • 已初始化数据段 .data
    • 包括静态常量
  • 未初始化数据段 .bss
    • 包括未初始化的静态变量
  • 堆段
    • 包括动态分配的内存,从低地址开始向上增长
  • 文件映射段
    • 包括动态库、共享内存等,从低地址开始向上增长(跟硬件和内核版本有关)
  • 栈段
    • 包括局部变量和函数调用的上下文等
  • 堆和文件映射段的内存动态分配
    • 比如使用C标准库的 malloc() 或 mmap() ,就可以分别在堆和文件映射段动态分配内存。

-页面置换算法

  • OPT 最佳置换算法

    • 无法实现,但作为评价基准
  • FIFO 先进先出页面置换算法

    • Belady异常
  • LRU 最近最久未使用置换算法

    • 最新访问放在第一位
    • 缓存满了删除末尾(最不经常访问的数据)

-磁盘调度算法

  • FCFS 先来先服务算法

  • SSF 最短寻道时间优先

    • 优先选择从当前磁头位置所需寻道时间最短的请求
    • 可能产生饥饿:磁头在一小块区域来回移动
  • SCAN 扫描算法(电梯算法)

    • 磁头在一个方向上移动,访问所有未完成的请求
    • 直到磁头到达该方向上的最后的磁道,才调换方向
      请添加图片描述
  • C-SCAN 循环扫描算法

    • 有磁头朝某个特定方向移动时,才处理磁道访问请求
    • 返回时直接快速移动至最靠边缘的磁道,也就是复位磁头,并且返回中途不处理任何请求
      请添加图片描述
  • LOOK与C-LOOK算法

    • SCAN的优化:LOOK。磁头在移动到「最远的请求」位置,然后立即反向移动
    • C-SCAN的优化:C-LOOK。反向移动途中不响应请求

文件系统

-组成

  • 一切皆文件
    请添加图片描述

  • Linux文件系统组成:

    • 索引节点 inode
      • 记录文件的元信息,如 inode 编号、文件大小、访问权限、创建时间、修改时间、数据在磁盘的位置等等
      • 索引节点是文件的唯一标识
    • 目录项 dentry
      • 记录文件的名字、索引节点指针以及与其他目录项的层级关联关系
  • 磁盘读写最小单位是扇区 512B

  • 文件系统把多个扇区组成了逻辑块

  • Linux中逻辑块大小为4KB,也就是8个扇区

-虚拟文件系统 VFS

  • Linux支持的文件系统分为三类:
    • 磁盘文件系统。占用磁盘空间。如Ext 2/3/4
    • 内存文件系统。占用内存空间。如/proc /sys
    • 网络文件系统。如NFS、SMB

文件的使用

  • 文件描述符 fd
  • 系统调用。open(); write(); close();
  • 打开文件表中维护打开文件的状态和信息:
    • 文件指针
    • 文件打开计数器
    • 文件磁盘位置
    • 访问权限

-文件存储

  • 连续空间存放

    • 指定起始块位置和长度
    • 缺点:磁盘空间碎片、文件长度不易扩展
  • 非连续空间存放方式

    • 链表方式索引方式

    • 「隐式链表」:文件头要包含「第一块」和「最后一块」的位置,并且每个数据块里面留出一个指针空间,用来存放下一个数据块的位置

    • 「显式链接」:把用于链接文件各数据块的指针,显式地存放在内存的一张链接表中,该表在整个磁盘仅设置一张,每个表项中存放链接指针,指向下一个数据块号

      • 文件分配表 FAT
    • 「索引数据块」:里面存放了指向文件数据块的指针列表(相当于书的目录)

      • 没有碎片问题
      • 方便创建、扩大、缩小
      • 支持顺序读写和随机读写
    • 「链式索引块」:链表加索引的组合

      • 在索引数据块留出一个存放下一个索引数据块的指针
        请添加图片描述
    • 「多级索引块」

-空闲空间管理

  • 空闲表法

  • 空闲链表法
    请添加图片描述

  • 位图法

-软链接和硬链接

  • 硬链接

    • 只有删除文件所有硬链接及源文件时,系统才会彻底删除该文件
  • 软链接

    • 跨文件系统
    • 相当于重新创建文件,有独立的inode
    • 该文件的内容是另外一个文件的路径

-文件I/O

  • 直接与非直接 I/O
  • 阻塞与非阻塞 I/O
    • I/O 多路复用技术。如select poll
  • 同步与异步 I/O

设备管理

  • 输入输出设备可分为两大类:

    • 块设备(Block Device)
    • 字符设备(Character Device)
  • 中断有两种:

    • 软中断,例如代码调用 INT 指令触发
    • 硬件中断,硬件通过中断控制器触发的
  • DMA

    • 设备在 CPU 不参与的情况下,能够自行完成把设备 I/O 数据放入到内存
      请添加图片描述
  • 设备驱动程序

  • 存储系统I/O软件分层

    • 文件系统层、通用块层、设备层
      请添加图片描述
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值