计算机底层知识

汇编语言(机器语言)的执行过程

汇编语言的本质:机器语言的助记符 其实他就是机器语言

计算机通电->CPU读取内存中程序(电信号输入)

->时钟发生器不断震荡通电 ->推动CPU内部一步一步执行(执行多少步取决于指令需要的时钟周期)

->计算完成 ->写回(电信号)->写给显卡输出(打印或者图形) 

CPU的基本组成

PC-> Program Counter 程序计数器 (记录当前指令地址)

Registers -> 暂时存储CPU计算需要用到的数据 (记存器)

ALU -> Arithmetic & Logic Unit 运算单元

CU -> Control Unit 控制单元

MMU -> Memory Management Unit 内存管理单元

缓存

缓存行:

缓存行越大,局部性空间效率越高,但读取时间慢

缓存行越小,局部性空间效率越低,但读取时间快

取一个折值,目前多用:64字节

缓存行对齐:对于有些特别敏感的数字,会存在线程高竞争的访问,为了保证不发生伪共享,可以使用缓存行对齐的编程方式

JDK7中,很多采用long padding提高效率

JDK8,加入了@Contened注解(实验)需要加上:-JVM -XX:-RestrictContended

乱序执行

CPU层面如何禁止重排序?

答:内存屏障 (对某部分内存做操作时前后添加的屏障,屏障前后的操作不可以乱序执行)

禁止乱序

cpu层面:inter ->原语(mfence ifence sfence)或者锁总线

jvm层级:8个hanppens-before原则,4个内存屏障 (LL LS SL SS)

as-if-serial:不管硬件什么顺序,单线程执行的结果不变,看上去像是serial

volatile的实现细节

JVM层面:

StoreStorBarier   volatile写操作    StoreLoadBarrier

LoadLoadBarrier  volatile读操作   LoadStoreBarrier

合并写 (不重要)

Write Combining Buffer

一般是四个字节

由于ALU速度太快,所以在写入L1的同时,写入一个WC Buffer,满了之后,再直接更新到L2

 NUMN

Non Uniform Memory Access

ZGC- NUMA aware

分配内存会优先分配该线程所在CPU的最近内存,可以显著提高效率,也可以访问其他内存,只不过效率较慢

启动过程(不重要)

通电-> bios uefi 工作 ->自检 -> 到硬盘固定位置加载bootloder -> 读取可配置信息 -> CMOS

                                                        

                                          OS基础

内核分类

微内核 - 弹性部署 5G loT

宏内核 - PC phone

外核 - 科研 实验中 为应用定制操作系统(多租户 request-basedGC JVM)

用户态与内核态

cpu分不同的指令级别

linux内核跑在ring 0级,用户程序跑在ring3,对于系统的关键访问,需要经过kernel的同意,保证系统健壮性

内核执行的操作 -> 200多个系统调用 sendfile read write pthread fork

JVM -> 站在OS的角度,就是一个普通程序

                                进程 线程 纤程 中断

面试高频:进程和线程有什么区别?

答案:进程就是一个程序运行起来的状态,线程是一个进程中的不同的执行路径。

专业回答:进程是OS分配资源的基本单位,线程是执行调度的基本单位。分配资源最重要的是:独立的内存空间,线程调度执行(线程共享进程的内存空间,没有独立的内存空间)

纤程:用户态的线程,线程中的线程,切换和调度不需要经过OS

优势:

  1.  占有资源很少OS:线程1M Fiber :4K
  2. 切换比较简单
  3. 启动很多个10w+

目前2020 3 22支持内置纤程的语言:Kotin Scala GO Python(lib)...   Java?(open jdk:loom)

Java中对于纤程的支持:没有内置,盼望内置

利用Quaser库 (不成熟)

纤程的应用场景

纤程 VS 线程池 :很短的计算任务,不需要和内核打交道,并发量高

进程

linux中也称为task,是系统分配资源的基本单位

资源:独立的地址空间 内核数据结构 (进程描述符...)全局变量 数据段...

进程描述符: PCB (Process Control Block)

什么是僵尸线程

        ps-ef | grep defuct 父进程产生子进程后,会维护进程的一个PCB结构,子进程退出,由父进程释放,如果父进程没有释放,那么子进程成为一个僵尸进程

什么是孤儿线程

        子进程结束之前,父进程已经退出,孤儿进程会成init进程的孩子,由1号进程维护 orphan.c

        

进程调度

2.6采用CFS调度策略:Completely Fair Scheduler

按优先级分配时间片的比例,记录每个进程的执行时间,如果有一个进程执行时间不到他应该分配的比例,优先执行

默认调度策略:

实时进程:(急诊)优先级分高低 - FIFO (First In First Out),优先级一样 - RR(Round Robin)

普通进程:CFS

中断

硬件跟操作系统内核打交道的一种机制

软中断(80中断)== 系统调用

系统调用: int 0x80 或者 sysenter原语通过ax寄存器填入调用号

参数通过bx cx dx si di传入内核返回值通过ax返回

java读网络 - jvm read() - c库read() - >内核空间 -> system_call() (系统带哦有处理程序) -> sys_read()

                                           内存管理

内存管理的发展历程

DOS时代 - 同一时间只能有一个进程在运行(也有一些特殊算法可以支持多线程)

windows9x - 多个进程装入内存 (问题)1:内存不够用  2:互相打扰

为了解决这两个问题,诞生了现在的内存管理系统:虚拟地址 分页装入 软硬件结合寻址

1.分页,内存中分成固定大小的页框(4k),把程序(硬盘上)分成4K大小的块,用到哪一块,加载哪一块,加载的过程中,如果内存已经满了,会把最不常用的一块分区放到swap分区,把最新的一块加载进来,这个就是著名的LRU算法 (力扣146题)

2.虚拟内存(解决相互打扰问题)

  1. DOS Win31 ...
  2. 为了保证互不影响 - 让进程工作在虚拟空间,程序中用到的空间地址不再是直接的物理地               址,而是虚拟的地址,这样,A进程永远不可能访问到B进程的空间
  3. 虚拟空间多大呢?寻址空间 - 64位置 2^64,比物理空间大很多,单位是byte
  4. 站在虚拟的角度,进程是独享整个系统 + CPU
  5. 内存映射:偏移量 + 段的基地址 = 线性地址 (虚拟空间)
  6. 线性地址通过OS + MMU (硬件 Memory Management Unit)

3.缺页中断

        1.需要用到页面内存中没有,产生缺页异常(中断),由内核处理并加载

为什么使用虚拟内存?

•隔离应用程序
-每个程序都认为自己有连续可用的内存
-突破物理内存限制
-应用程序不需要考虑物理内存是否够用,是否能够分配等底层问题

•安全
-保护物理内存,不被恶意程序访问

ZGC

算法叫做 : Colored Pointer

GC信息记录在指针是,不是记录在头部,immediate memory use

42位指针 寻址空间4T JDK13 -> 16T 目前为止最大16T (2^44)

CPU如何区分一个立即数和一条指令

总线内部分为:数据总线 地址总线 控制总线

地址总线目前:48位

                                内核同步机制

关于同步理论的一些基本概念

  • 临界区(critical area):访问或操作共享数据的代码段。简单理解:synchronized大括号中部分(原子性)
  • 竞争条件(race conditions)两个线程同时拥有临界区的执行权
  • 数据不一致:data unconsistency 由竞争条件引起的数据破坏
  • 同步(synchronization)避免race conditions
  • 锁:完成同步的手段(门锁,门后是临界区,只允许一个线程存在)
  • 上锁解锁必须具备原子性
  • 原子性(象原子一样不可分割的操作)
  • 有序性(禁止指令重排)
  • 可见性(一个线程内的修改,另一个线程可见)
  • 互斥锁,排它锁,共享锁,分他锁

 内核同步常用方法

  1. 原子操作-内核中类似于AtomicXXX,位于<linux/types.h>
  2. 自旋锁-内核中通过汇编支持的cas,位于<asm/spinlock.h>
  3. 读-写自旋-类似于ReadWriteLock,可同时读,只能一个写读的时候是共享锁,写的时候是排他锁
  4. 信号量-类似于Semaphore(PV操作 down up操作 占有和释放)重量级锁,线程会进入wait,适合长时间持有的锁情况
  5. 读-写信号量-downread upread downwrite upwrite(多个写,可以分段写,比较少用)(分段锁)
  6. 互斥体(mutex)-特殊的信号量(二值信号量)
  7. 完成变量-特殊的信号量(A发出信号给B,B等待在完成变量上。vfork()在子进程结束时通过完成变量叫醒父进程 类似于(Latch)
  8. BKL:大内核锁(早期,现在已经不用)
  9. 顺序销(26) 一线程可以挂起的迹写自旋锁序列计数器(从0开始,写时增加(+1),写完释放(+1),读前发现单数,说明有写线程,等待,读前读后序列一样,说明没有写线程打断)
  10. 禁止抢占-preempt disable)
  11. 内存屏障-见volatile

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值