计算机底层知识

最新推荐文章于 2024-07-23 19:39:32 发布

一只程序烽.

最新推荐文章于 2024-07-23 19:39:32 发布

阅读量631

点赞数

文章标签： jvm java 开发语言

本文链接：https://blog.csdn.net/weixin_63331779/article/details/130732334

版权

汇编语言（机器语言）的执行过程

汇编语言的本质：机器语言的助记符其实他就是机器语言

计算机通电->CPU读取内存中程序（电信号输入）

->时钟发生器不断震荡通电 ->推动CPU内部一步一步执行（执行多少步取决于指令需要的时钟周期）

->计算完成 ->写回（电信号）->写给显卡输出（打印或者图形）

CPU的基本组成

PC-> Program Counter 程序计数器（记录当前指令地址）

Registers -> 暂时存储CPU计算需要用到的数据（记存器）

ALU -> Arithmetic & Logic Unit 运算单元

CU -> Control Unit 控制单元

MMU -> Memory Management Unit 内存管理单元

缓存

缓存行：

缓存行越大，局部性空间效率越高，但读取时间慢

缓存行越小，局部性空间效率越低，但读取时间快

取一个折值，目前多用：64字节

缓存行对齐：对于有些特别敏感的数字，会存在线程高竞争的访问，为了保证不发生伪共享，可以使用缓存行对齐的编程方式

JDK7中，很多采用long padding提高效率

JDK8，加入了@Contened注解（实验）需要加上：-JVM -XX：-RestrictContended

乱序执行

CPU层面如何禁止重排序？

答：内存屏障（对某部分内存做操作时前后添加的屏障，屏障前后的操作不可以乱序执行）

禁止乱序

cpu层面：inter ->原语（mfence ifence sfence）或者锁总线

jvm层级：8个hanppens-before原则，4个内存屏障（LL LS SL SS）

as-if-serial:不管硬件什么顺序，单线程执行的结果不变，看上去像是serial

volatile的实现细节

JVM层面:

StoreStorBarier volatile写操作 StoreLoadBarrier

LoadLoadBarrier volatile读操作 LoadStoreBarrier

合并写（不重要）

Write Combining Buffer

一般是四个字节

由于ALU速度太快，所以在写入L1的同时，写入一个WC Buffer，满了之后，再直接更新到L2

NUMN

Non Uniform Memory Access

ZGC- NUMA aware

分配内存会优先分配该线程所在CPU的最近内存，可以显著提高效率，也可以访问其他内存，只不过效率较慢

启动过程（不重要）

通电-> bios uefi 工作 ->自检 -> 到硬盘固定位置加载bootloder -> 读取可配置信息 -> CMOS

OS基础

内核分类

微内核 - 弹性部署 5G loT

宏内核 - PC phone

外核 - 科研实验中为应用定制操作系统（多租户 request-basedGC JVM）

用户态与内核态

cpu分不同的指令级别

linux内核跑在ring 0级，用户程序跑在ring3，对于系统的关键访问，需要经过kernel的同意，保证系统健壮性

内核执行的操作 -> 200多个系统调用 sendfile read write pthread fork

JVM -> 站在OS的角度，就是一个普通程序

进程线程纤程中断

面试高频：进程和线程有什么区别？

答案：进程就是一个程序运行起来的状态，线程是一个进程中的不同的执行路径。

专业回答：进程是OS分配资源的基本单位，线程是执行调度的基本单位。分配资源最重要的是：独立的内存空间，线程调度执行（线程共享进程的内存空间，没有独立的内存空间）

纤程：用户态的线程，线程中的线程，切换和调度不需要经过OS

优势：

占有资源很少OS：线程1M Fiber :4K
切换比较简单
启动很多个10w+

目前2020 3 22支持内置纤程的语言：Kotin Scala GO Python(lib)... Java?（open jdk:loom）

Java中对于纤程的支持：没有内置，盼望内置

利用Quaser库（不成熟）

纤程的应用场景

纤程 VS 线程池：很短的计算任务，不需要和内核打交道，并发量高

进程

linux中也称为task，是系统分配资源的基本单位

资源：独立的地址空间内核数据结构（进程描述符...）全局变量数据段...

进程描述符： PCB （Process Control Block）

什么是僵尸线程

ps-ef | grep defuct 父进程产生子进程后，会维护进程的一个PCB结构，子进程退出，由父进程释放，如果父进程没有释放，那么子进程成为一个僵尸进程

什么是孤儿线程

子进程结束之前，父进程已经退出，孤儿进程会成init进程的孩子，由1号进程维护 orphan.c

进程调度

2.6采用CFS调度策略：Completely Fair Scheduler

按优先级分配时间片的比例，记录每个进程的执行时间，如果有一个进程执行时间不到他应该分配的比例，优先执行

默认调度策略：

实时进程：（急诊）优先级分高低 - FIFO (First In First Out)，优先级一样 - RR（Round Robin）

普通进程：CFS

中断

硬件跟操作系统内核打交道的一种机制

软中断（80中断）== 系统调用

系统调用： int 0x80 或者 sysenter原语通过ax寄存器填入调用号

参数通过bx cx dx si di传入内核返回值通过ax返回

java读网络 - jvm read() - c库read() - >内核空间 -> system_call() (系统带哦有处理程序) -> sys_read()

内存管理

内存管理的发展历程

DOS时代 - 同一时间只能有一个进程在运行（也有一些特殊算法可以支持多线程）

windows9x - 多个进程装入内存（问题）1：内存不够用 2：互相打扰

为了解决这两个问题，诞生了现在的内存管理系统：虚拟地址分页装入软硬件结合寻址

1.分页，内存中分成固定大小的页框（4k），把程序（硬盘上）分成4K大小的块，用到哪一块，加载哪一块，加载的过程中，如果内存已经满了，会把最不常用的一块分区放到swap分区，把最新的一块加载进来，这个就是著名的LRU算法（力扣146题）

2.虚拟内存（解决相互打扰问题）

DOS Win31 ...
为了保证互不影响 - 让进程工作在虚拟空间，程序中用到的空间地址不再是直接的物理地址，而是虚拟的地址，这样，A进程永远不可能访问到B进程的空间
虚拟空间多大呢？寻址空间 - 64位置 2^64，比物理空间大很多，单位是byte
站在虚拟的角度，进程是独享整个系统 + CPU
内存映射：偏移量 + 段的基地址 = 线性地址（虚拟空间）
线性地址通过OS + MMU （硬件 Memory Management Unit）

3.缺页中断

1.需要用到页面内存中没有，产生缺页异常（中断），由内核处理并加载

为什么使用虚拟内存？

•隔离应用程序
-每个程序都认为自己有连续可用的内存
-突破物理内存限制
-应用程序不需要考虑物理内存是否够用，是否能够分配等底层问题

•安全
-保护物理内存，不被恶意程序访问

ZGC

算法叫做： Colored Pointer

GC信息记录在指针是，不是记录在头部，immediate memory use

42位指针寻址空间4T JDK13 -> 16T 目前为止最大16T （2^44）

CPU如何区分一个立即数和一条指令

总线内部分为：数据总线地址总线控制总线

地址总线目前：48位

内核同步机制

关于同步理论的一些基本概念

临界区(critical area)：访问或操作共享数据的代码段。简单理解：synchronized大括号中部分(原子性)
竞争条件(race conditions)两个线程同时拥有临界区的执行权
数据不一致：data unconsistency 由竞争条件引起的数据破坏
同步(synchronization)避免race conditions
锁：完成同步的手段(门锁，门后是临界区，只允许一个线程存在)
上锁解锁必须具备原子性
原子性(象原子一样不可分割的操作)
有序性（禁止指令重排）
可见性（一个线程内的修改，另一个线程可见）
互斥锁，排它锁，共享锁，分他锁

内核同步常用方法

原子操作-内核中类似于AtomicXXX，位于<linux/types.h>
自旋锁-内核中通过汇编支持的cas，位于<asm/spinlock.h>
读-写自旋-类似于ReadWriteLock，可同时读，只能一个写读的时候是共享锁，写的时候是排他锁
信号量-类似于Semaphore(PV操作 down up操作占有和释放）重量级锁，线程会进入wait，适合长时间持有的锁情况
读-写信号量-downread upread downwrite upwrite(多个写，可以分段写，比较少用)(分段锁)
互斥体（mutex)-特殊的信号量（二值信号量）
完成变量-特殊的信号量（A发出信号给B，B等待在完成变量上。vfork()在子进程结束时通过完成变量叫醒父进程类似于(Latch)
BKL：大内核锁（早期，现在已经不用）
顺序销（26）一线程可以挂起的迹写自旋锁序列计数器（从0开始，写时增加(+1)，写完释放(+1)，读前发现单数，说明有写线程，等待，读前读后序列一样，说明没有写线程打断)
禁止抢占-preempt disable)
内存屏障-见volatile