JAVA程序员应该了解的计算机底层原理

CPU

CPU的组成

CUP的组成很复杂,这里只列举学习JAVA可能会用到的。

1.PC(Program Counter) 程序计数器:
记录当前指令地址

2.Registers 寄存器:
暂时储存CPU计算所需要的数据

3.ALU(Arithmetic Logic Unit) 逻辑运算单元:
进行逻辑运算

4.CU(Control Unit) 控制单元:
负责程序的流程管理

5.MMU(Memory Management Unit) 内存管理单元:
负责处理CPU的内存访问请求

6.Cache 缓存:
L1、L2、L3 三级缓存,由1到3 读取速度依次降低,缓存大小依次增加

缓存

1.缓存一致性协议:
MESI  具体参考: [缓存一致性协议](https://www.cnblogs.com/z00377750/p/9180644.html)

2.缓存行:
CPU读取内存并不是一个字节一个字节的读取,而是一块一块的读取,遵循缓存行越大,局部空间效率越高,
但读取时间慢,缓存行越小,局部空间效率越低,但读取时间快的规律目前大多取一个折中值 64 个字节。

3. 缓存行对齐:
因为每次读取都是64个字节,假设一个CUP两个核心A和B,一段64个字节的代码块包含两个元素在z、x,A核心
需要读取代码块上的z元素就会把这整个代码块作为缓存行读到CPU中,B核心需要读取代码块上的x元素也会将
这整个代码块读进去。这时候如果要求缓存一致性,并且A核心对Z进行修改,那么B核心就会重新去内存上读取
Z,这样会导致B核心的资源浪费。对于这样一些特别敏感的例子,会存在线程竞争访问,为了保证不发生伪共享,可
以使用缓存行对齐的编程方式

4.JAVA中的缓存行对齐
JDK8以前采用long padding提高效率。
JDK8以后提供了@Contended注解 使用这个注解需要加上JVM参数:-xx: -RestrictContended

乱序执行

CPU对于没有相互依赖的相邻几行代码会自主选择最优执行方式,可能会打乱执行顺序。例如生活中的烧水泡茶如果
按顺序做会是:

在这里插入图片描述
而经过CPU优化后可能会变成:
在这里插入图片描述

这就是CPU的乱序执行。

禁止乱序

1.CPU层面:
提供了禁止乱序的指令IFence(读屏障),MFence(读写屏障),sFence(写屏障)
大部分CPU都提供了Lock指令用来禁止乱序(volatile使用了这条指令)
2.JVM层面
提供了4种内存屏障,LoadLoad,LoadStore,StoreLoad,StoreStore
3.as-if-serial
不管硬件什么顺序,单线程执行的结果不变,看上去像是serial

问DCL单例需不需要加Volatile?
答:需要,因为创建对象的过程并不是一步到位的,我们可以粗浅的将它分为三步,第一步先new一个对象这时候对象
为NULL,第二步调用构造方法给对象赋值,第三步将对象指向引用,如果不加就可能导致重复创建对象。

在这里插入图片描述

合并写

Write Combining Buffer
一般是4个字节
由于ALU速度太快,所以在写入L1的同时,写入一个WC Buffer,满了之后,再直接更新到L2

NUMA

Non Uniform Memory Access
ZGC - NUMA aware 
分配内存会优先分配该线程所在CPU的最近内存

OS

内核的分类

1.宏内核
	 - PC phone
2.微内核
 	- 弹性部署 5G IoT
3.外内核
	- 科研 实验中 为应用定制操作系统 (多租户 request-based GC JVM)

用户态和内核态

cpu分不同的指令级别
linux内核跑在ring 0级, 用户程序跑在ring 3,对于系统的关键访问,需要经过kernel的同意,保证系统健壮性
内核执行的操作 - > 200多个系统调用 sendfile read write pthread fork 
JVM -> 站在OS老大的角度,就是个普通程序

进程线程纤程中断

1.进程
	-操作系统分配资源的基本单位(程序运行起来的状态)分配资源最重要的是:独立的内存空间,线程调度执行
	(线程共享进程的内存空间,没有自己独立的内存空间)
2.线程
	-执行任务调度的基本单位(一个进程中的不同的执行路径)
3.纤程
	-用户态的线程,线程中的线程,切换和调度不需要经过OS
4.纤程的优势
	-占用资源少,操作系统创建线程占用1M的内存,纤程只需要4k
	-切换比较简单,不经过操作系统用户态直接切换。
	-启动数量可以很多
5.目前支持纤程的语言
	-GO,Kotlin, Scala 内置支持
	- python (lib) java(open jdk : loom)
6.纤程VS纤程池
	-很短的计算任务,不需要和内核打交道,并发量高!
7.僵尸进程
	-父进程产生子进程后会维护一个子进程的PCB(process controle block) 结构,子进程退出后由父进程释放
	如果子进程退出后父进程没有释放,那么子进程成为一个僵尸进程
8.孤儿进程
	-子进程结束之前父进程已经退出,那么子进程会成为孤儿进程,这时候子进程会成为init的孩子,由一号进程
	维护子进程的PCB结构
9.进程调度
	-Linux2.6 采用completely fair scheduler 即完全公平策略
	-OS按照优先级分配时间片段比例,记录每个进程的执行时间,如果某个进程的执行时间不到他分配的比例那么
	 优先执行
	-默认调度策略:
		实时进程优先级不一样的情况下执行FIFO策略
		实时进程优先级一样的情况下执行RR策略(轮询)
		普通进程 CFS策略即完全公平策略
10.中断
	-硬中断:硬件跟操作系统打交道的一种机制
	-软中断:即系统调用
	-系统调用: int ox80 或者 sysenter 原语 通过ax寄存器填入调用号,bx,cx,dx,si,di传入参数到内核 
	 返回值通过ax返回

内存管理

1.内存管理的发展历程:
	Dos时代同一时间只能有一个进程在运行(也有一些特殊算法可以支持多进程。
	windows9x - 多个进程装入内存 ,但是出现相应问题 :
	
	1:内存不够用 
	
	2:互相打扰
    
    为了解决这两个问题,诞生了现在的内存管理系统:虚拟地址 分页装入 软硬件结合寻址
    
    A:分页(解决内存不够用问题)
	    内存中分成固定大小的页框(4K),把程序(硬盘上)分成4K大小的块,用到哪一块,加载那一块,加载的
	    过程中,如果内存已经满了,会把最不常用的一块放到swap分区, 把最新的一块加载进来,这个就是著名的
	    LRU算法
	    	LRU算法:
			Least Recently Used 最不常用算法
			哈希表(保证 查找操作O(1)) + 链表 (保证 排序操作和新增操作 O(1)))
			双向链表 (保证 左边指针 指向右边块)
		
    B:虚拟内存(解决相互打扰问题)
	    1:DOS Win31系统时代  程序之间出现互相干掉的问题
	    2:为了保证互不影响 - 让进程工作在虚拟空间,程序中用到的空间地址不再是直接的物理地址,而是
	      虚拟的地址,这样,A进程永远不可能访问到B进程的空间
	    3:虚拟空间多大呢?寻址空间 - 64位系统 2 ^ 64,比物理空间大很多 ,单位是byte
	    4:站在虚拟的角度,进程是独享整个系统 + CPU
	    5:内存映射:偏移量 + 段的基地址 = 线性地址 (虚拟空间)
	    6:线性地址通过 OS + MMU(硬件 Memory Management Unit)去计算
	    
	C:缺页中断
		需要用到页面内存中没有,产生缺页异常(中断),由内核处理并加载
2: ZGC 算法叫做:Colored Pointer
GC信息记录在指针上,不是记录在头部,
优势  immediate memory use(直接使用内存,不用再去更改maker Word上面的信息)
42位指针 寻址空间4T JDK13 -> 16T 目前为止最大16T 2^44
颜色指针本质上包含了地址映射的概念

CPU如何区分一个立即数 和 一条指令

总线内部分为:数据总线 地址总线 控制总线
从什么总线来的他就是什么类型
地址总线目前:48位

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值