1. 冯诺依曼体系结构
我们常见的计算机,如笔记本。我们不常见的计算机,如服务器,大部分都遵守冯诺依曼体系
截至目前,我们所认识的计算机,都是有一个个的硬件组件组成
- 输入单元:包括键盘, 鼠标,扫描仪, 写板等
- 中央处理器(CPU):含有运算器和控制器等
- 输出单元:显示器,打印机等
关于冯诺依曼,必须强调几点:
- 这里的存储器指的是内存
- 不考虑缓存情况,这里的CPU能且只能对内存进行读写,不能访问外设(输入或输出设备)
- 外设(输入或输出设备)要输入或者输出数据,也只能写入内存或者从内存中读取。
- 一句话,所有设备都只能直接和内存打交道。
对冯诺依曼的理解,不能停留在概念上,要深入到对软件数据流理解上,请解释,从你登录上qq开始和某位朋友聊天开始,数据的流动过程。从你打开窗口,开始给他发消息,到他的到消息之后的数据流动过程。如果是在qq上发送文件呢?
2. 操作系统(Operator System)
2.1 概念
任何计算机系统都包含一个基本的程序集合,称为操作系统(OS)。笼统的理解,操作系统包括:
- 内核(进程管理,内存管理,文件管理,驱动管理)
- 其他程序(例如函数库,shell程序等等)
2.2 设计OS的目的
- 与硬件交互,管理所有的软硬件资源
- 为用户程序(应用程序)提供一个良好的执行环境
2.3 定位
- 在整个计算机软硬件架构中,操作系统的定位是:一款纯正的“搞管理”的软件
2.4 如何理解 “管理”
- 管理的例子
- 描述被管理对象
- 组织被管理对象
2.5 总结
计算机管理硬件
- 描述起来,用struct结构体
- 组织起来,用链表或其他高效的数据结构
2.6 系统调用和库函数概念
- 在开发角度,操作系统对外会表现为一个整体,但是会暴露自己的部分接口,供上层开发使用,这部分由操作系统提供的接口,叫做系统调用。
- 系统调用在使用上,功能比较基础,对用户的要求相对也比较高,所以,有心的开发者可以对部分系统调用进行适度封装,从而形成库,有了库,就很有利于更上层用户或者开发者进行二次开发。
承上启下
那操作系统是怎么管理进行进程管理的呢?很简单,先把进程描述起来,再把进程组织起来!
3. 进程
3.1 基本概念
课本概念:程序的一个执行实例,正在执行的程序等
内核观点:担当分配系统资源(CPU时间,内存)的实体。
3.2 描述进程 – PCB
- 进程信息被放在一个叫做进程控制块的数据结构中,可以理解为进程属性的集合。
- 课本上称之为PCB(process control block),Linux操作系统下的PCB是: task_struct
task_struct-PCB的一种
- 在Linux中描述进程的结构体叫做task_struct。
- task_struct是Linux内核的一种数据结构,它会被装载到RAM(内存)里并且包含着进程的信息。
3.3 task_ struct内容分类
- 标示符: 描述本进程的唯一标示符,用来区别其他进程。
- 状态: 任务状态,退出代码,退出信号等。
- 优先级: 相对于其他进程的优先级。
- 程序计数器: 程序中即将被执行的下一条指令的地址。
- 内存指针: 包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针
- 上下文数据: 进程执行时处理器的寄存器中的数据[休学例子,要加图CPU,寄存器]。
- I/O状态信息: 包括显示的I/O请求,分配给进程的I/O设备和被进程使用的文件列表。
- 记账信息: 可能包括处理器时间总和,使用的时钟数总和,时间限制,记账号等。
- 其他信息
3.4 组织进程
可以在内核源代码里找到它。所有运行在系统里的进程都以task_struct链表的形式存在内核里。
3.5 查看进程
进程的信息可以通过 /proc 系统文件夹查看
- 如:要获取PID为1的进程信息,你需要查看 /proc/1 这个文件夹
- 其中,蓝色的数字都是运行中的进程id。
- 大多数进程信息同样可以使用top和ps这些用户级工具来获取
首先来创建一个测试进程的c文件:
c文件内容如红框所示:
#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main()
{
while(1)
{
printf("solity\n");
sleep(1);
}
return 0;
}
测试进程:
ps ajx | head -1 && ps axj | grep 'test'
测试结果显示:
3.6 通过系统调用获取进程标示符
- 进程id(PID)
- 父进程id(PPID)
test.c文件测试代码:
#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main()
{
while(1)
{
pid_t pid = getpid(); //获取的是自己的进程PID
pid_t ppid = getppid(); //获取的是父进程的进程PID
printf("hello solity, pid: %d,ppid: %d\n",pid,ppid);
sleep(1);
}
return 0;
}
测试结果:
此时,我们可以查看一下父进程到底是谁,也就是ppid。综上我们来查看进程ppid为8390的进程状态:
可以发现,父进程就是bash ---- 也就是shell命令行,也叫外壳命令。
bash的ppid并不是唯一的,每链接一次shell,就是一个新的shell bash。
3.7 通过系统调用创建进程 — fork
-
运行 man fork 认识fork
-
fork有两个返回值
-
父子进程代码共享,数据各自开辟空间,私有一份(采用写时拷贝)
-
fork 之后通常要用 if 进行分流
我们首先来看一下无fork的运行结果:
test.c测试代码:
#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main()
{
printf("I am parent process!!\n");
//fork();
printf("You can see me!!\n");
sleep(1);
}
return 0;
}
测试结果:
从运行结果可以看到,fork后面的语句输出结果只有一个。
当添加fork之后,test.c测试代码:
#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main()
{
printf("I am parent process!!\n");
fork();
printf("You can see me!!\n");
sleep(1);
return 0;
}
测试结果:
添加fork后,fork之后的语句输出结果出现了两个!!!
这就很好玩了,我们再来测试一下fork的进程,test.c测试代码:
#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main()
{
printf("I am parent process!!\n");
pid_t ret = fork();
printf("ret: %d\n",ret);
sleep(1);
return 0;
}
多次测试结果:
可以发现,ret即是0,又是多变的!!!
这是又产生了疑惑,到底谁是父进程,谁是子进程呢?我们继续测试:
test.c测试代码:
#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main()
{
printf("I am parent process : pid: %d\n",getpid());
pid_t ret = fork();
printf("ret: %d, pid: %d, ppid: %d\n", ret, getpid(), getppid());
sleep(1);
return 0;
}
测试结果:
从测试结果可以结论:在fork之后,给子进程返回的是0.给父进程返回的是子进程的pid。即上面测试结果中给父进程返回的是11283,也就是子进程的pid值。