1.冯诺依曼体系结构
我们常见的计算机,如笔记本。我们不常见的计算机,如服务器,大部分都遵守冯诺依曼体系
输入设备:键盘,鼠标,扫描仪,画板...
中央处理器(CPU):含有运算器和控制器等
输出设备:显示器,打印机等
关于冯诺依曼,必须强调几点:
1.这里的存储器指的是内存
2.不考虑缓存情况,这里的CPU能且只能对内存进行读写,不能访问外设(输入或输出设备)
3.外设(输入或输出设备)要输入或者输出数据,也只能写入内存或者从内存中读取。
一句话,所有设备都只能直接和内存打交道
2.操作系统(Operator System)简介
概念:
任何计算机系统都包含一个基本的程序集和,称为操作系统(OS)
操作系统包括:
内核(进程管理,内存管理,文件管理,驱动管理)
其他程序(例如函数库,shell程序等等)
设计OS的目的:
与硬件交互,管理所有的软硬件资源
为用户程序(应用程序)提供一个良好的执行环境
定位:
在整个计算机软硬件架构中,操作系统的定位是:一款纯正的“搞管理”的软件
整个计算机的软硬件体系结构:
总结
计算机管理硬件:
描述起来:用struct结构体(PCB)
组织起来:用链表或其他高效的数据结构
系统调用和数据库的概念:
在开发角度,操作系统对外会表现为一个整体,但是会暴露自己的部分接口,供上层开发使用,这部分由操作系统提供的接口,叫做系统调用。
系统调用在使用上,功能比较基础,对用户的要求相对也比较高,所以,有心的开发者可以对部分系统调用进行适度封装,从而形成库,有了库,就很有利于更上层用户或者开发者进行二次开发。
进程
基本概念:
课本概念:程序的一个执行实例,正在执行的程序等
内核观点:担当分配系统资源(CPU时间,内存)的实体
描述进程-PCB
进程信息被放在一个叫做进程控制块的数据结构中,可以理解为进程属性的集合。
课本上称之为PCB(process control block),Linux操作系统下的PCB是: task_struct
task_struct-PCB的一种
在Linux中描述进程的结构体叫做task_struct。
task_struct是Linux内核的一种数据结构,它会被装载到RAM(内存)里并且包含着进程的信息
task_ struct内容分类
标示符: 描述本进程的唯一标示符,用来区别其他进程。
状态: 任务状态,退出代码,退出信号等。
优先级: 相对于其他进程的优先级。
程序计数器: 程序中即将被执行的下一条指令的地址。
内存指针: 包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针
上下文数据: 进程执行时处理器的寄存器中的数据[休学例子,要加图CPU,寄存器]。
I/O状态信息: 包括显示的I/O请求,分配给进程的I/O设备和被进程使用的文件列表。
记账信息: 可能包括处理器时间总和,使用的时钟数总和,时间限制,记账号等。
其他信息
组织进程:
可以在内核源代码里找到它。所有运行在系统里的进程都以task_struct链表的形式存在内核里。
查看进程:
先写一个死循环代码,之后将其编译成程序,并运行
复制ssh渠道,让一边运行,一边去进行查看进程
用: ps axj | head -1 && ps ajx | grep process 可以进行查找进程
其中ps axj 时查看所有指令 head -1是显示第一行的属性列表 grep process 用grop指令筛选process
可以找到如上信息,第二行的信息可以不用管,他是grep的进程信息,因为我们是用来grep来进行查找
如果我们再运行一次该程序,会发现此时能查找到两个进程
在属性列我们可以看到有一个PID属性信息,这就是进程再PCB中的序号
我们可以用 /proc 系统文件夹查看
蓝色数字的目录就是各个进程的PID
我们可以用过之前运行的进程PID进入该进程的类别,就能查看该进程的属性了
getpid和getppid
getpid()
输入指令 man gitpid查看该指令的详细信息,用法和所需头文件
这个函数的意思就是虽在运行时调用它,他就返回谁的PID
将代码改为:
运行起来:
我们每次在运行同一个进程的时候进程的PID不一样是正常的
getppid()
因为我们的进程也有父子兄弟关系,这里我们先来谈谈父子关系,父进程PPID
将代码改为:
运行:
可以发现我们的PID是会变化的,而父进程的PID是不会发生变化的
我们对父进程的PID5336进程查找
我们可以看到这各进程叫做bash
bash是命令行解释器,它本质上也是一个进程!
命令行启动的所有程序,最终都会编程进程,而该进程对应的父进程都是bash(如何做到的?)
在程序运行过程中我们要停止它的运行,除了ctrl+c之外还可以用:kill -9 PID,如下:
那我们是不是也可以通过它来杀掉bash呢?
当然也是能杀掉的,杀掉之后bash就无法正常工作了,当然我们只需要重新进一下就行
如果bash没有创建子进程,当我们代码有问题的时候,bash也会跟着崩溃
这就是为什么我们在命令行里面启动的程序,他们的都有父进程bash
bash也有父PID,在往上走就到系统层了,我们不考虑
如何创建子进程的呢?fork函数
fork可以在程序层面创建子进程。
可以看到第二个printf函数被调用了两次,这是因为程序在经过fork时创建了一个子进程18505
其父进程是18504,bash是1213
fork的返回值:
在创建成功的时候,给父进程返回子进程的PID,给子进程返回0
创建失败的时候,返回-1
奇怪的事:
一个函数有两个返回值
同一地址读取的数据不同(现在讲不清楚,到后面谈)
fork使用的方式
一般我们在使用fork的时候不会像上面描述的那样,
而是:
fork之后,执行流会变成2各个执行流
fork之后,谁先运行由调度器决定
fork之后,代码共享,通常我们用if和elseif来进行执行流的分流!
原理:
fork做了什么?
fork如何看待——代码和数据
fork如何理解这两个返回值问题
fork做了什么?
如何看待fork?
进程在运行的时候,是具有独立性的!父子进程,在运行的时候,也是一样的!
代码:代码是只读的
数据:当有一个执行流尝试修改数据的时候,OS会自动给问当前程序出发:写时拷贝
如下,我们加上一个变量x=100;并在之后的父进程将其进行改变,改为x=123:
可以看到父子进程刚开始x的值都是100,后来父进程才变为了123
如何理解fork由两个返回值的问题
因为return的时候系统也进行了写实拷贝,
这个地址相同,其实系统用的时虚拟地址而不是实际的物理地址