JVM学习笔记java虚拟机教程

JVM

面试常见

  • 请你谈谈你对JVM的理解? java8虚拟机和之前的变化更新?
  • 什么是OOM,什么是栈溢出StackOverFlowError? 怎么分析?
  • JVM的常用调优参数有哪些?
  • 内存快照如何抓取,怎么分析Dump文件?
  • 谈谈JVM中,类加载器你的认识

1、JVM的位置

image-20200901111410408

2、JVM体系结构

image-20200901145309178

3、类加载器

作用:加载class文件

image-20200901112047319
  • 虚拟机自带的加载器

  • BootstrapClassLoader(启动类加载器

c++编写,加载java核心库 java.*,构造ExtClassLoader和AppClassLoader。由于引导类加载器涉及到虚拟机本地实现细节,开发者无法直接获取到启动类加载器的引用,所以不允许直接通过引用进行操作
  • ExtClassLoader (标准扩展类加载器
java编写,加载扩展库,如classpath中的jre ,javax.*或者
java.ext.dir 指定位置中的类,开发者可以直接使用标准扩展类加载器。
  • AppClassLoader(系统类加载器
java编写,加载程序所在的目录,如user.dir所在的位置的class
  • CustomClassLoader(用户自定义类加载器
java编写,用户自定义的类加载器,可加载指定路径的class文件

4、双亲委派机制

双亲委派机制 : 安全

AppClassLoader–>ExtClassLoader–>BootstrapClassLoader(最终执行)

  1. 类加载器收到类加载的请求
  2. 将这个请求向上委托给父类加载器去完成,一 直向上委托,直到启动类加载器
  3. 启动加载器检查是否能够加载当前这个类,能加载就结束, 使用当前的加载器,否则, 抛出异常,通知子加载器进行加载
  4. 重复步骤3

Class Not Found异常就是这么来的

Java早期的名字:C+±-

Java = C++:去掉繁琐的东西,指针,内存管理~

双亲委派机制 : 作用

  1. 防止重复加载同一个.class。通过委托去向上面问一问,加载过了,就不用再加载一遍。保证数据安全。

  2. 保证核心.class不能被篡改。通过委托方式,不会去篡改核心.class,即使篡改也不会去加载,即使加载也

    不会是同一个.class对象了。不同的加载器加载同一个.class也不是同一个Class对象。这样保证了Class执行安全。

5、沙箱安全机制

Java安全模型的核心就是Java沙箱(sandbox)

什么是沙箱?沙箱是一个限制程序运行的环境。沙箱机制就是将Java代码限定在虚拟机(JVM)特定的运行范围中,

并且严格限制代码对本地系统资源访问,通过这样的措施来保证对代码的有效隔离,防止对本地系统造成破坏。

沙箱主要限制系统资源访问,那系统资源包括什么? CPU、内存、文件系统、网络。不同级别的沙箱对这些资源访

问的限制也可以不一样。

所有的Java程序运行都可以指定沙箱,可以定制安全策略。

在Java中将执行程序分成本地代码和远程代码两种,本地代码默认视为可信任的,而远程代码则被看作是不受信

的。对于授信的本地代码,可以访问一切本地资源。而对于非授信的远程代码在早期的Java实现中,安全依赖于沙

箱Sandbox)机制。如下图所示JDK1.0安全模型

image-20200901144833539

但如此严格的安全机制也给程序的功能扩展带来障碍,比如当用户希望远程代码访问本地系统的文件时候,就无法

实现。因此在后续的Java1.1版本中,针对安全机制做了改进,增加了安全策略,允许用户指定代码对本地资源的

访问权限。如下图所示JDK1.1安全模型

image-20200901144858891

在Java1.2版本中,再次改进了安全机制,增加了代码签名。不论本地代码或是远程代码,都会按照用户的安全策

略设定,由类加载器加载到虚拟机中权限不同的运行空间,来实现差异化的代码执行权限控制。如下图所示

image-20200901144922036

当前最新的安全机制实现,则引入了域(Domain)的概念。虚拟机会把所有代码加载到不同的系统域和应用域,系统

域部分专门负责与关键资源进行交互,而各个应用域部分则通过系统域的部分代理来对各种需要的资源进行访问。

虚拟机中不同的受保护域(Protected Domain),对应不一样的权限(Permission)。存在于不同域中的类文件就具有

了当前域的全部权限,如下图所示最新的安全模型(jdk 1.6)

image-20200901144937143

组成沙箱的基本组件

  • 字节码校验器(bytecode verifier) :确保Java类文件遵循Java语言规范。这样可以帮助Java程序实现内存保护。

  • 但并不是所有的类文件都会经过字节码校验,比如核心类。

  • 类裝载器(class loader) :其中类装载器在3个方面对Java沙箱起作用

    1. 它防止恶意代码去干涉善意的代码 //双亲委派机制
    2. 它守护了被信任的类库边界
    3. 它将代码归入保护域,确定了代码可以进行哪些操作

    虚拟机为不同的类加载器载入的类提供不同的命名空间,命名空间由一系列唯一的名称组成, 每一个被装载

    的类将有一个名字,这个命名空间是由Java虚拟机为每一个类装载器维护的,它们互相之间甚至不可见。

类装载器采用的机制是双亲委派模式

  1. 从最内层JVM自带类加载器开始加载,外层恶意同名类得不到加载从而无法使用;
  2. 由于严格通过包来区分了访问域,外层恶意的类通过内置代码也无法获得权限访问到内层类,破坏代码就自然无法生效。
  • 存取控制器(access controller) :存取控制器可以控制核心API对操作系统的存取权限,而这个控制的策略设定,可以由用户指定。
  • 安全管理器(security manager) : 是核心API和操作系统之间的主要接口。实现权限控制,比存取控制器优先级高。
  • 安全软件包(security package) : java.security下的类和扩展包下的类,允许用户为自己的应用增加新的安全特性,包括:
    1. 安全提供者
    2. 消息摘要
    3. 数字签名
    4. 加密
    5. 鉴别

6、Native

  • native :凡是带了native关键字的,说明java的作用范围达不到了,回去调用底层c语言的库!
  • 会进入本地方法栈
  • 调用本地方法本地接口 JNI (Java Native Interface)
  • JNI作用:开拓Java的使用,融合不同的编程语言为Java所用!最初: C、C++
  • Java诞生的时候C、C++横行,想要立足,必须要有调用C、C++的程序
  • 它在内存区域中专门开辟了一块标记区域: Native Method Stack,登记native方法
  • 在最终执行的时候,加载本地方法库中的方法通过JNI
  • 例如:Java程序驱动打印机,管理系统,掌握即可,在企业级应用比较少
  • private native void start0();
  • 调用其他接口:Socket. . WebService~. .http~

Native Method Stack

它的具体做法是Native Method Stack中登记native方法,在( Execution Engine )执行引擎执行的时候加载

Native Libraies。[本地库]

Native Interface本地接口

本地接口的作用是融合不同的编程语言为Java所用,它的初衷是融合C/C++程序, Java在诞生的时候是C/C++横行

的时候,想要立足,必须有调用C、C++的程序,于是就在内存中专门开辟了块区域处理标记为native的代码,它

的具体做法是在Native Method Stack 中登记native方法,在( Execution Engine )执行引擎执行的时候加载Native

Libraies。

目前该方法使用的越来越少了,除非是与硬件有关的应用,比如通过Java程序驱动打印机或者Java系统管理生产

设备,在企业级应用中已经比较少见。因为现在的异构领域间通信很发达,比如可以使用Socket通信,也可以使用

Web Service等等,不多做介绍!

7、PC寄存

程序计数器: Program Counter Register

每个线程都有一个程序计数器,是线程私有的,就是一个指针, 指向方法区中的方法字节码(用来存储指向像一条

指令的地址, 也即将要执行的指令代码),在执行引擎读取下一条指令, 是一个非常小的内存空间,几乎可以忽略

不计

8、方法区 Method Area

方法区是被所有线程共享,所有字段和方法字节码,以及一些特殊方法,如构造函数,接口代码也在此定义,简单

说,所有定义的方法的信息都保存在该区域,此区域属于共享区间;

静态变量、常量、类信息(构造方法、接口定义)、运行时的常量池存在方法区中,但是实例变量存在堆内存中,

和方法区无关

image-20200901150302245

9、栈

栈:先进后出

桶:后进先出

队列:先进先出( FIFO : First Input First Output )

栈:栈内存,主管程序的运行,生命周期和线程同步;

线程结束,栈内存也就是释放,对于栈来说,不存在垃圾回收问题

一旦线程结束,栈就Over!

栈内存中:

8大基本类型+对象引用+实例的方法

image-20200901151155460

栈运行原理:栈帧

栈满了: StackOverflowError

image-20200901151009814

10、三种JVM

  • Sun公司HotSpot Java Hotspot™ 64-Bit Server VM (build 25.181-b13,mixed mode)

  • BEA JRockit

  • IBM J9VM

    我们学习都是: Hotspot

11、堆

Heap, 一个JVM只有一个堆内存,堆内存的大小是可以调节的。

类加载器读取了类文件后,一般会把什么东西放到堆中?

类,方法,常量,变量~,保存我们所有引用类型的真实对象;

堆内存中还要细分为三个区域:

image-20200901151823273

GC垃圾回收,主要是在伊甸园区和养老区~

假设内存满了,OOM,堆内存不够! java.lang.OutOfMemoryError:Java heap space

永久存储区里存放的都是Java自带的 例如lang包中的类 如果不存在这些,Java就跑不起来了

在JDK8以后,永久存储区改了个名字(元空间)

12.新生区、老年区

新生区

  • 类 : 诞生和成长的地方,甚至死亡;
  • 伊甸园,所有的对象都是在伊甸园区new出来的!
  • 幸存者区(0,1)

伊甸园满了就触发轻GC,经过轻GC存活下来的就到了幸存者区,幸存者区满之后意味着新生区也满了,则触发

重GC,经过重GC之后存活下来的就到了养老区。

真理:经过研究,99%的对象都是临时对象!

13、永久区

这个区域常驻内存的。用来存放JDK自身携带的Class对象。Interface元数据,存储的是Java运行时的一些环境~

这个区域不存在垃圾回收,关闭虚拟机就会释放内存

  • jdk1.6之前 : 永久代,常量池是在方法区
  • jdk1.7 : 永久代,但是慢慢的退化了,去永久代,常量池在堆中
  • jdk1.8之后 : 无永久代,常量池在元空间
image-20200901153331963

元空间:逻辑上存在,物理上不存在 (因为存储在本地磁盘内) 所以最后并不算在JVM虚拟机内存中

14.堆内存调优

在一个项目中,突然出现了OOM故障,那么该如何排除 研究为什么出错~

  • 能够看到代码第几行出错:内存快照分析工具,MAT, Jprofiler
  • Dubug, 一行行分析代码!

MAT, Jprofiler作用

  • 分析Dump内存文件,快速定位内存泄露;
  • 获得堆中的数据
  • 获得大的对象~

MAT是eclipse集成使用 在这里不学

Jprofile使用

  1. 在idea中下载jprofile插件
  2. 联网下载jprofile客户端
  3. 在idea中VM参数中写参数 -Xms1m -Xmx8m -XX: +HeapDumpOnOutOfMemoryError
  4. 运行程序后在jprofile客户端中打开找到错误 告诉哪个位置报错

命令参数详解

// -Xms设置初始化内存分配大小1/64

// -Xmx设置最大分配内存,默以1/4

// -XX: +PrintGCDetails // 打印GC垃圾回收信息

// -XX: +HeapDumpOnOutOfMemoryError //oom DUMP

15、GC

image-20200901160510393

JVM在进行GC时,并不是对这三个区域统一回收。 大部分时候,回收都是新生代~

  • 新生代

  • 幸存区(form,to)

  • 老年区

GC两种类:轻GC (普通的GC), 重GC (全局GC)

GC常见面试题目 :

  • JVM的内存模型和分区~详细到每个区放什么?

  • 堆里面的分区有哪些?

    • Eden, form, to, 老年区,说说他们的特点!
  • GC的算法有哪些?

    • 标记清除法,标记整理(压缩),复制算法,引用计数器
  • 轻GC和重GC分别在什么时候发生?

算法

引用计数法:

image-20200901160839186

复制算法

image-20200901161428662
  • 好处 : 没有内存的碎片~

  • 坏处 : 浪费了内存空间~ :多了一半空间永远是空to。假设对象100%存活(极端情况)

复制算法最佳使用场景:对象存活度较低的时候;新生区~

image-20200901161703700

标记清除算法

image-20200901162105860

优点:不需要额外的空间!

缺点:两次扫描,严重浪费时间,会产生内存碎片

标记压缩

image-20200901162251309

标记清除压缩

先标记清除几次

image-20200901162520454

再压缩

image-20200901162455452

四种垃圾收集器

Java 8可以将垃圾收集器分为四类。

串行收集器Serial

为单线程环境设计且只使用一个线程进行GC,会暂停所有用户线程,不适用于服务器。就像去餐厅吃饭,只有一个清

洁工在打扫。

并行收集器Parrallel

使用多个线程并行地进行GC,会暂停所有用户线程,适用于科学计算、大数据后台,交互性不敏感的场合。多个清洁工同时在打扫。

并发收集器CMS

用户线程和GC线程同时执行(不一定是并行,交替执行),GC时不需要停顿用户线程,互联网公司多用,适用对响应时间有要求的场合。清洁工打扫的时候,也可以就餐。

G1收集器

对内存的划分与前面3种很大不同,将堆内存分割成不同的区域,然后并发地进行垃圾回收。

默认垃圾收集器

Serial 、 Parallel 、 ConcMarkSweep (CMS)、 ParNew 、 ParallelOld 、 G1 。还有一个 SerialOld ,快被淘汰了。

查看默认垃圾修改器

使用 java -XX:+PrintCommandLineFlags 即可看到,Java 8默认使用 -XX:+UseParallelGC

-XX:InitialHeapSize=132375936 -XX:MaxHeapSize=2118014976 - XX:+PrintCommandLineFlags -XX:+UseCompressedClassPointers -XX:+UseCompressedOops - XX:-UseLargePagesIndividualAllocation -XX:+UseParallelGC

七大垃圾收集器

体系结构

SerialParallel ScavengeParNew用户回收新生代;SerialOldParallelOldCMS用于回收老年代。而G1收集器,既可以回收新生代,也可以回收老年代。

连线表示可以搭配使用,红叉表示不推荐一同使用,比如新生代用Serial,老年代用CMS

image-20200901171512697

Serial收集器

年代最久远,是Client VM模式下的默认新生代收集器,使用复制算法优点:单个线程收集,没有线程切换开销,拥有最高的单线程GC效率。缺点:收集的时候会暂停用户线程。

使用-XX:+UseSerialGC可以显式开启,开启后默认使用Serial+SerialOld的组合。

ParNew收集器

也就是Serial的多线程版本,GC的时候不再是一个线程,而是多个,是Server VM模式下的默认新生代收集器,采用复制算法

使用-XX:+UseParNewGC可以显式开启,开启后默认使用ParNew+SerialOld的组合。但是由于SerialOld已经过时,所以建议配合CMS使用。

image-20200901171450221

Parallel Scavenge收集器

ParNew收集器仅在新生代使用多线程收集,老年代默认是SerialOld,所以是单线程收集。而Parallel Scavenge在新、老两代都采用多线程收集。Parallel Scavenge还有一个特点就是吞吐量优先收集器,可以通过自适应调节,保证最大吞吐量。采用复制算法

使用-XX:+UseParallelGC可以开启, 同时也会使用ParallelOld收集老年代。其它参数,比如-XX:ParallelGCThreads=N可以选择N个线程进行GC,-XX:+UseAdaptiveSizePolicy使用自适应调节策略。

SerialOld收集器

Serial的老年代版本,采用标整算法。JDK1.5之前跟Parallel Scavenge配合使用,现在已经不了,作为CMS的后备收集器。

ParallelOld收集器

Parallel的老年代版本,JDK1.6之前,新生代用Parallel而老年代用SerialOld,只能保证新生代的吞吐量。JDK1.8后,老年代改用ParallelOld

使用-XX:+UseParallelOldGC可以开启, 同时也会使用Parallel收集新生代。

CMS收集器

并发标记清除收集器,是一种以获得最短GC停顿为目标的收集器。适用在互联网或者B/S系统的服务器上,这类应用尤其重视服务器的响应速度,希望停顿时间最短。是G1收集器出来之前的首选收集器。使用标清算法。在GC的时候,会与用户线程并发执行,不会停顿用户线程。但是在标记的时候,仍然会STW

使用-XX:+UseConcMarkSweepGC开启。开启过后,新生代默认使用ParNew,同时老年代使用SerialOld作为备用。

过程

  1. 初始标记:只是标记一下GC Roots能直接关联的对象,速度很快,需要STW
  2. 并发标记:主要标记过程,标记全部对象,和用户线程一起工作,不需要STW。
  3. 重新标记:修正在并发标记阶段出现的变动,需要STW
  4. 并发清除:和用户线程一起,清除垃圾,不需要STW。

优缺点

优点:停顿时间少,响应速度快,用户体验好。

缺点

  1. 对CPU资源非常敏感:由于需要并发工作,多少会占用系统线程资源。
  2. 无法处理浮动垃圾:由于标记垃圾的时候,用户进程仍然在运行,无法有效处理新产生的垃圾。
  3. 产生内存碎片:由于使用标清算法,会产生内存碎片。
G1收集器

G1收集器与之前垃圾收集器的一个显著区别就是——之前收集器都有三个区域,新、老两代和元空间。而G1收集器只有G1区和元空间。而G1区,不像之前的收集器,分为新、老两代,而是一个一个Region,每个Region既可能包含新生代,也可能包含老年代。

G1收集器既可以提高吞吐量,又可以减少GC时间。最重要的是STW可控,增加了预测机制,让用户指定停顿时间。

使用-XX:+UseG1GC开启,还有-XX:G1HeapRegionSize=n-XX:MaxGCPauseMillis=n等参数可调。

特点

  1. 并行和并发:充分利用多核、多线程CPU,尽量缩短STW。
  2. 分代收集:虽然还保留着新、老两代的概念,但物理上不再隔离,而是融合在Region中。
  3. 空间整合G1整体上看是标整算法,在局部看又是复制算法,不会产生内存碎片。
  4. 可预测停顿:用户可以指定一个GC停顿时间,G1收集器会尽量满足。

过程

CMS类似。

  1. 初始标记。
  2. 并发标记。
  3. 最终标记。
  4. 筛选回收。

总结

内存效率:复制算法 > 标记清除算法 > 标记压缩算法 (时间复杂度)

内存整齐度:复制算法 = 标记清除算法 > 标记压缩算法

内存利用率:复制算法 < 标记清除算法 = 标记压缩算法

思考一个问题:难道没有最优算法吗?

答案:没有,没有最好的算法,只有最合适的算法------>GC:分代收集法

分代收集算法就是根据对象的年代,采用上述三种算法来收集。

  1. 对于新生代:每次GC都有大量对象死去,存活的很少,常采用复制算法,只需要拷⻉很少的对象。
  2. 对于老年代:常采用标整或者标清算法。

年轻代:

  • 存活率低
  • 复制算法

老年代:

  • 区域大 : 存活率高
  • 标记清除(内存碎片不是太多)+ 标记压缩混合实现
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值