操作系统底层的整体认识

一、冯诺依曼计算机模型详解

现代计算机模型是基于–冯诺依曼计算机模型
计算机在运行时,先从内存中取出第一条指令,通过控制器的译码,按指令的要求,从存储器中取出数据进行指定的运算和逻辑操作等加工,然后再按地址把结果送到内存中去。接下来,再取出第二条指令,在控制器的指挥下完成规定操作。依此进行下去。直至遇到停止指令。
程序与数据一样存贮,按程序编排的顺序,一步一步地取出指令,自动地完成指令规定的操作是计算机最基本的工作模型。这一原理最初是由美籍匈牙利数学家冯.诺依曼于1945年提出来的,故称为冯.诺依曼计算机模型。
在这里插入图片描述

1、计算机五大核心组合部分介绍

(1)控制器(Control):是整个计算机的中枢神经,其功能是对程序规定的控制信息进行解释,根据其要求进行控制,调度程序、数据、地址,协调计算机各部分工作及内存与外设的访问等。
(2)运算器(Datapath):运算器的功能是对数据进行各种算术运算和逻辑运算,即对数据进行加工处理。
(3)存储器(Memory):存储器的功能是存储程序、数据和各种信号、命令等信息,并在需要时提供这些信息。
(4)输入(Input system):输入设备是计算机的重要组成部分,输入设备与输出设备合你为外部设备,简称外设,输入设备的作用是将程序、原始数据、文字、字符、控制命令或现场采集的数据等信息输入到计算机。常见的输入设备有键盘、鼠标器、光电输入机、磁带机、磁盘机、光盘机等。
(5)输出(Output system):输出设备与输入设备同样是计算机的重要组成部分,它把外算机的中间结果或最后结果、机内的各种数据符号及文字或各种控制信号等信息输出出来。微机常用的输出设备有显示终端CRT、打印机、激光印字机、绘图仪及磁带、光盘机等。

具体应用就是现代计算机当中的硬件结构设计:
最核心的两部分:CPU、内存,也是我们重点关注对象
在这里插入图片描述

2、CPU的指令结构

CPU的内部结构:
在这里插入图片描述(1)控制单元

控制单元是整个CPU的指挥控制中心,由指令寄存器IR(Instruction Register)、指令译码器ID(Instruction Decoder)和 操作控制器OC(Operation Controller) 等组成,对协调整个电脑有序工作极为重要。它根据用户预先编好的程序,依次从存储器中取出各条指令,放在指令寄存器IR中,通过指令译码(分析)确定应该进行什么操作,然后通过操作控制器OC,按确定的时序,向相应的部件发出微操作控制信号。
操作控制器OC中主要包括:节拍脉冲发生器、控制矩阵、时钟脉冲发生器、复位电路和启停电路等控制逻辑。

(2)运算单元

运算单元是运算器的核心。可以执行算术运算(包括加减乘数等基本运算及其附加运算)和逻辑运算(包括移位、逻辑测试或两个值比较)。相对控制单元而言,运算器接受控制单元的命令而进行动作,即运算单元所进行的全部操作都是由控制单元发出的控制信号来指挥的,所以它是执行部件。

(3)存储单元

存储单元包括 CPU 片内缓存Cache和寄存器组,是 CPU 中暂时存放数据的地方,里面保存着那些等待处理的数据,或已经处理过的数据,CPU 访问寄存器所用的时间要比访问内存的时间短。 寄存器是CPU内部的元件,寄存器拥有非常高的读写速度,所以在寄存器之间的数据传送非常快。采用寄存器,可以减少 CPU 访问内存的次数,从而提高了 CPU 的工作速度。
寄存器组可分为专用寄存器和通用寄存器。专用寄存器的作用是固定的,分别寄存相应的数据;而通用寄存器用途广泛并可由程序员规定其用途。

3、CPU内存结构

现代CPU为了提升执行效率,减少CPU与内存的交互(交互影响CPU效率),一般在CPU上集成了多级缓存架构,常见的为三级缓存结构:

L1 Cache,分为数据缓存指令缓存,逻辑核独占
L2 Cache,物理核独占,逻辑核共享
L3 Cache,所有物理核共享

在这里插入图片描述

(1)存储器存储空间大小:内存>L3>L2>L1>寄存器;
(2)存储器速度快慢排序:寄存器>L1>L2>L3>内存;
(3)缓存行:缓存的最小存储区块;
缓存行大小计算:假设缓存行大小一般为64byte,L1大小为512kb,则L1一共有512*1024/64个缓存行

3.1、CPU读取存储器数据过程

简单来说就是:从内存到L3到L2到L1再到寄存器
(1)CPU要取寄存器X的值,只需要一步:直接读取
(2)CPU要取L1 cache的某个值,需要1-3步(或者更多):把cache行锁住,把某个数据拿来,解锁,如果没锁住就慢了。
(3)CPU要取L2 cache的某个值,先要到L1 cache里取,L1当中不存在,在L2里,L2开始加锁,加锁以后,把L2里的数据复制到L1,再执行读L1的过程,上面的3步,再解锁。
(4)CPU取L3 cache的也是一样,只不过先由L3复制到L2,从L2复制到L1,从L1到CPU。
(5)CPU取内存则最复杂:通知内存控制器占用总线带宽,通知内存加锁,发起内存读请求,等待回应,回应数据保存到L3(如果没有就到L2),再从L3/2到L1,再从L1到CPU,之后解除总线锁定。

3.2、CPU需要高速缓存区的原因

为了解决CPU运算速度与内存读写速度不匹配的矛盾,因为CPU运算速度要比内存读写速度快多,这样会使CPU花费很长时间等待数据到来或把数据写入内存。在缓存中的数据是内存中的一小部分,但这一小部分是短时间内CPU即将访问的,当CPU调用大量数据时,就可避开内存直接从缓存中调用,从而加快读取速度。

3.3、局部性原理

在CPU访问存储设备时,无论是存取数据抑或存取指令,都趋于聚集在一片连续的区域中,这就被称为局部性原理。

(1)时间局部性(Temporal Locality):如果一个信息项正在被访问,那么在近期它很可能还会被再次访问。比如循环、递归、方法的反复调用等。
(2)空间局部性(Spatial Locality):如果一个存储器的位置被引用,那么将来他附近的位置也会被引用。(因为缓存的最小存储区块是缓存行,则同一行的数据前后将会一起被引用)比如顺序执行的代码、连续创建的两个对象、数组等。
体现空间局部性的例子
结果是: spend time1远远小于 spend time2
原因:long[1024×1024][6]通过第一种方式(按照行)来加载时,根据空间局部性,CPU和内存交互一次可以加载6个节点,所以一共是1024×1024次;通过第二种方式(按照列)来加载时,因为不符合空间局部性所以CPU和内存交互时一次只能加载1个节点,则一共是1024×1024×6次

public class TwoDimensionalArraySum {
    private static final int RUNS = 100;
    private static final int DIMENSION_1 = 1024 * 1024;
    private static final int DIMENSION_2 = 6;
    private static long[][] longs;

    public static void main(String[] args) throws Exception {
        /*
         * 初始化数组
         */
        longs = new long[DIMENSION_1][];
        for (int i = 0; i < DIMENSION_1; i++) {
            longs[i] = new long[DIMENSION_2];
            for (int j = 0; j < DIMENSION_2; j++) {
                longs[i][j] = 1L;
            }
        }
        System.out.println("Array初始化完毕....");

        long sum = 0L;
        long start = System.currentTimeMillis();
        for (int r = 0; r < RUNS; r++) {
            for (int i = 0; i < DIMENSION_1; i++) {//DIMENSION_1=1024*1024
                for (int j=0;j<DIMENSION_2;j++){//6
                    sum+=longs[i][j];
                }
            }
        }
        System.out.println("spend time1:"+(System.currentTimeMillis()-start));
        System.out.println("sum1:"+sum);

        sum = 0L;
        start = System.currentTimeMillis();
        for (int r = 0; r < RUNS; r++) {
            for (int j=0;j<DIMENSION_2;j++) {//6
                for (int i = 0; i < DIMENSION_1; i++){//1024*1024
                    sum+=longs[i][j];
                }
            }
        }
        System.out.println("spend time2:"+(System.currentTimeMillis()-start));
        System.out.println("sum2:"+sum);
    }
}
3.4、CPU运行安全级别

(1)CPU有四个运行级别,分别为ring0、ring1、ring2、ring3,安全性从高到低。
(2)目前的Linux和Windows只用到了ring0和ring3级别,操作系统在ring0,操作系统以外的第三方程序运行在ring3。
(3)第三方程序如果要调用操作系统内部函数功能,由于运行安全级别不够,必须切换CPU运行状态,从ring3切换到ring0,然后执行系统函数(案例:JVM创建线程,线程阻塞唤醒是重型操作了,因为CPU要切换运行状态。)
(4)JVM创建线程CPU的工作流程:

step1:CPU从ring3切换ring0创建线程
step2:创建完毕,CPU从ring0切换回ring3
step3:线程执行JVM程序
step4:线程执行完毕,销毁还得切回ring0

二、操作系统内存管理

1、内核空间和用户空间

操作系统有用户空间与内核空间两个概念,目的也是为了做到程序运行安全隔离与稳定

进程与线程只能运行在用户方式(usermode)或内核方式(kernelmode)下。用户程序运行在用户方式下,而系统调用运行在内核方式下。在这两种方式下所用的堆栈不一样:用户方式下用的是一般的堆栈(用户空间的堆栈),而内核方式下用的是固定大小的堆栈(内核空间的对战,一般为一个内存页的大小),即每个进程与线程其实有两个堆栈,分别运行用户态与内核态

2、线程和进程的状态转换

一般一个线程或者进程是有两个堆栈的,一个堆栈放在内核空间,一个堆栈放在用户空间,为什么要有两个状态,因为他需要进行状态的切换,假设程序在运行时,突然需要创建一个线程,创建线程的这个工作就需要OS(操作系统)去完成,所以进程的状态就切换了,切换到内核空间中,并且将用户空间的堆栈信息放到内核空间对应的那个堆栈,然后创建完线程,这个线程有操作系统去管理,而进程又切换到用户空间,这个过程我们叫做状态的切换。

3、内核线程模型(KLT)和用户线程模型(ULT)

根据CPU调度的基本单位线程进行划分,简单来说就是线程和进程是由谁来当主导决定的

(1)内核线程(KLT):系统内核管理线程(KLT),内核保存线程的状态和上下文信息,线程阻塞不会引起进程阻塞。在多处理器系统上,多线程在多处理器上并行运行。线程的创建、调度和管理由内核完成,效率比ULT要慢,比进程操作快。
(2)用户线程(ULT):用户程序实现,不依赖操作系统核心,应用提供创建、同步、调度和管理线程的函数来控制用户线程。不需要用户态/内核态切换,速度快。内核对ULT无感知,线程阻塞则进程(包括它的所有线程)阻塞。

java在1.4之前(这块的版本不太能确定)用的是ULT,后来用的是KLT,ULT不能发挥CPU的多核性能。

4、线程与进程

在一个进程里可以创建多个线程

(1)进程:现代操作系统在运行一个程序时,会为其创建一个进程;例如,启动一个Java程序,操作系统就会创建一个Java进程。进程是OS(操作系统)资源分配的最小单位
(2)线程线程是OS(操作系统)调度CPU的最小单元,也叫轻量级进程(Light Weight Process)。在一个进程里可以创建多个线程,这些线程都拥有各自的计数器、堆栈和局部变量等属性,并且能够访问共享的内存变量。CPU在这些线程上高速切换,让使用者感觉到这些线程在同时执行,即并发的概念,相似的概念还有并行!
(3)线程和进程的上下文切换:简单来理解就是一个线程正在运行时,突然CPU要执行另一个线程,会把这个线程的状态保存下来,切换到另一个线程继续工作,这就是线程的上下文切换,数据保存在内存的TSS(Task State Segment)任务状态段。在这里插入图片描述

三、虚拟机指令集架构

虚拟机指令集架构主要分两种:(1)栈指令集架构(2)寄存器指令集架构

1、栈指令集架构

(1)设计和实现更简单,适用于资源受限的系统;
(2)避开了寄存器的分配难题:使用零地址指令方式分配;
(3)指令流中的指令大部分是零地址指令,其执行过程依赖与操作栈,指令集更小,编译器容易实现;
(4)不需要硬件支持,可移植性更好,更好实现跨平台。

Java符合典型的栈指令集架构特征,像Python、Go都属于这种架构。

2、寄存器指令集架构

(1)典型的应用是x86的二进制指令集:比如传统的PC以及Android的Davlik虚拟机。
(2)指令集架构则完全依赖硬件,可移植性差。
(3)性能优秀和执行更高效。
(4)花费更少的指令去完成一项操作。
(5)在大部分情况下,基于寄存器架构的指令集往往都以一地址指令、二地址指令和三地址指令为主,而基于栈式架构的指令集却是以零地址指令为主。

  • 4
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值