CPU
CPU的组成
CUP的组成很复杂,这里只列举学习JAVA可能会用到的。
1.PC(Program Counter) 程序计数器:
记录当前指令地址
2.Registers 寄存器:
暂时储存CPU计算所需要的数据
3.ALU(Arithmetic Logic Unit) 逻辑运算单元:
进行逻辑运算
4.CU(Control Unit) 控制单元:
负责程序的流程管理
5.MMU(Memory Management Unit) 内存管理单元:
负责处理CPU的内存访问请求
6.Cache 缓存:
L1、L2、L3 三级缓存,由1到3 读取速度依次降低,缓存大小依次增加
缓存
1.缓存一致性协议:
MESI 具体参考: [缓存一致性协议](https://www.cnblogs.com/z00377750/p/9180644.html)
2.缓存行:
CPU读取内存并不是一个字节一个字节的读取,而是一块一块的读取,遵循缓存行越大,局部空间效率越高,
但读取时间慢,缓存行越小,局部空间效率越低,但读取时间快的规律目前大多取一个折中值 64 个字节。
3. 缓存行对齐:
因为每次读取都是64个字节,假设一个CUP两个核心A和B,一段64个字节的代码块包含两个元素在z、x,A核心
需要读取代码块上的z元素就会把这整个代码块作为缓存行读到CPU中,B核心需要读取代码块上的x元素也会将
这整个代码块读进去。这时候如果要求缓存一致性,并且A核心对Z进行修改,那么B核心就会重新去内存上读取
Z,这样会导致B核心的资源浪费。对于这样一些特别敏感的例子,会存在线程竞争访问,为了保证不发生伪共享,可
以使用缓存行对齐的编程方式
4.JAVA中的缓存行对齐
JDK8以前采用long padding提高效率。
JDK8以后提供了@Contended注解 使用这个注解需要加上JVM参数:-xx: -RestrictContended
乱序执行
CPU对于没有相互依赖的相邻几行代码会自主选择最优执行方式,可能会打乱执行顺序。例如生活中的烧水泡茶如果
按顺序做会是:
而经过CPU优化后可能会变成:
这就是CPU的乱序执行。
禁止乱序
1.CPU层面:
提供了禁止乱序的指令IFence(读屏障),MFence(读写屏障),sFence(写屏障)
大部分CPU都提供了Lock指令用来禁止乱序(volatile使用了这条指令)
2.JVM层面
提供了4种内存屏障,LoadLoad,LoadStore,StoreLoad,StoreStore
3.as-if-serial
不管硬件什么顺序,单线程执行的结果不变,看上去像是serial
问DCL单例需不需要加Volatile?
答:需要,因为创建对象的过程并不是一步到位的,我们可以粗浅的将它分为三步,第一步先new一个对象这时候对象
为NULL,第二步调用构造方法给对象赋值,第三步将对象指向引用,如果不加就可能导致重复创建对象。
合并写
Write Combining Buffer
一般是4个字节
由于ALU速度太快,所以在写入L1的同时,写入一个WC Buffer,满了之后,再直接更新到L2
NUMA
Non Uniform Memory Access
ZGC - NUMA aware
分配内存会优先分配该线程所在CPU的最近内存
OS
内核的分类
1.宏内核
- PC phone
2.微内核
- 弹性部署 5G IoT
3.外内核
- 科研 实验中 为应用定制操作系统 (多租户 request-based GC JVM)
用户态和内核态
cpu分不同的指令级别
linux内核跑在ring 0级, 用户程序跑在ring 3,对于系统的关键访问,需要经过kernel的同意,保证系统健壮性
内核执行的操作 - > 200多个系统调用 sendfile read write pthread fork
JVM -> 站在OS老大的角度,就是个普通程序
进程线程纤程中断
1.进程
-操作系统分配资源的基本单位(程序运行起来的状态)分配资源最重要的是:独立的内存空间,线程调度执行
(线程共享进程的内存空间,没有自己独立的内存空间)
2.线程
-执行任务调度的基本单位(一个进程中的不同的执行路径)
3.纤程
-用户态的线程,线程中的线程,切换和调度不需要经过OS
4.纤程的优势
-占用资源少,操作系统创建线程占用1M的内存,纤程只需要4k
-切换比较简单,不经过操作系统用户态直接切换。
-启动数量可以很多
5.目前支持纤程的语言
-GO,Kotlin, Scala 内置支持
- python (lib) java(open jdk : loom)
6.纤程VS纤程池
-很短的计算任务,不需要和内核打交道,并发量高!
7.僵尸进程
-父进程产生子进程后会维护一个子进程的PCB(process controle block) 结构,子进程退出后由父进程释放
如果子进程退出后父进程没有释放,那么子进程成为一个僵尸进程
8.孤儿进程
-子进程结束之前父进程已经退出,那么子进程会成为孤儿进程,这时候子进程会成为init的孩子,由一号进程
维护子进程的PCB结构
9.进程调度
-Linux2.6 采用completely fair scheduler 即完全公平策略
-OS按照优先级分配时间片段比例,记录每个进程的执行时间,如果某个进程的执行时间不到他分配的比例那么
优先执行
-默认调度策略:
实时进程优先级不一样的情况下执行FIFO策略
实时进程优先级一样的情况下执行RR策略(轮询)
普通进程 CFS策略即完全公平策略
10.中断
-硬中断:硬件跟操作系统打交道的一种机制
-软中断:即系统调用
-系统调用: int ox80 或者 sysenter 原语 通过ax寄存器填入调用号,bx,cx,dx,si,di传入参数到内核
返回值通过ax返回
内存管理
1.内存管理的发展历程:
Dos时代同一时间只能有一个进程在运行(也有一些特殊算法可以支持多进程。
windows9x - 多个进程装入内存 ,但是出现相应问题 :
1:内存不够用
2:互相打扰
为了解决这两个问题,诞生了现在的内存管理系统:虚拟地址 分页装入 软硬件结合寻址
A:分页(解决内存不够用问题)
内存中分成固定大小的页框(4K),把程序(硬盘上)分成4K大小的块,用到哪一块,加载那一块,加载的
过程中,如果内存已经满了,会把最不常用的一块放到swap分区, 把最新的一块加载进来,这个就是著名的
LRU算法
LRU算法:
Least Recently Used 最不常用算法
哈希表(保证 查找操作O(1)) + 链表 (保证 排序操作和新增操作 O(1)))
双向链表 (保证 左边指针 指向右边块)
B:虚拟内存(解决相互打扰问题)
1:DOS Win31系统时代 程序之间出现互相干掉的问题
2:为了保证互不影响 - 让进程工作在虚拟空间,程序中用到的空间地址不再是直接的物理地址,而是
虚拟的地址,这样,A进程永远不可能访问到B进程的空间
3:虚拟空间多大呢?寻址空间 - 64位系统 2 ^ 64,比物理空间大很多 ,单位是byte
4:站在虚拟的角度,进程是独享整个系统 + CPU
5:内存映射:偏移量 + 段的基地址 = 线性地址 (虚拟空间)
6:线性地址通过 OS + MMU(硬件 Memory Management Unit)去计算
C:缺页中断
需要用到页面内存中没有,产生缺页异常(中断),由内核处理并加载
2: ZGC 算法叫做:Colored Pointer
GC信息记录在指针上,不是记录在头部,
优势 immediate memory use(直接使用内存,不用再去更改maker Word上面的信息)
42位指针 寻址空间4T JDK13 -> 16T 目前为止最大16T 2^44
颜色指针本质上包含了地址映射的概念
CPU如何区分一个立即数 和 一条指令
总线内部分为:数据总线 地址总线 控制总线
从什么总线来的他就是什么类型
地址总线目前:48位