JVM探究
- 请你谈谈你对JVM的理解?Java8虚拟机和之前的变化更新?
- 什么是OOM,什么是栈溢出StackOverFlowError?怎么分析
- JVM的常用调优参数有哪些?
- 内存快照如何抓取,怎么分析Dump文件?知道吗?
- 谈谈JVM中,类加载器你的认识?
jvm是什么:
JVM是Java Virtual Machine的缩写。它是一种基于计算设备的规范,是一台虚拟机,即虚构的计算机。
JVM屏蔽了具体操作系统平台的信息(显然,就像是我们在电脑上开了个虚拟机一样),当然,JVM执行字节码时实际上还是要解释成具体操作平台的机器指令的。
通过JVM,Java实现了平台无关性,Java语言在不同平台运行时不需要重新编译,只需要在该平台上部署JVM就可以了。因而能实现一次编译多处运行。(就像是你的虚拟机也可以在任何安了VMWare的系统上运行)
JRE 和JDK:
JRE:Java Runtime Environment,也就是JVM的运行平台,联系平时用的虚拟机,大概可以理解成JRE=虚拟机平台+虚拟机本体(JVM)。类似于你电脑上的VMWare+适用于VMWare的Ubuntu虚拟机。这样我们也就明白了JVM到底是个什么。
JDK:Java Develop Kit,Java的开发工具包,JDK本体也是Java程序,因此运行依赖于JRE,由于需要保持JDK的独立性与完整性,JDK的安装目录下通常也附有JRE。目前Oracle提供的Windows下的JDK安装工具会同时安装一个正常的JRE和隶属于JDK目录下的JRE。
文章目录
一. JVM的位置
二. JVM的大致体系结构
三.类加载器
作用:加载CLass文件
类是一个模板,new出的对象是一个实体
类加载器的分类:
1.虚拟机自带的加载器
2.启动类(根)加载器
3.扩展类加载器
4.应用程序(系统类)加载器
public class Car {
public int age;
public static void main(String[] args) {
//类是模板,对象是具体的
Car car1 = new Car();
Car car2 = new Car();
Car car3 = new Car();
System.out.println(car1.hashCode());
System.out.println(car2.hashCode());
System.out.println(car3.hashCode());
Class<? extends Car> aClass1 = car1.getClass();
ClassLoader classLoader = aClass1.getClassLoader();
System.out.println(classLoader); //AppClassLoader 自定义类加载器
System.out.println(classLoader.getParent()); //ExtClassLoader ->\jre\lib\ext包下
System.out.println(classLoader.getParent().getParent()); //null Java程序获取不到->rt.jar包下
}
}
---------------结果---------------
325040804
1173230247
856419764
sun.misc.Launcher$AppClassLoader@18b4aac2
sun.misc.Launcher$ExtClassLoader@2503dbd3
null
四.双亲委派机制
双亲委派机制:安全
当一个类被加载,他首先是委托上级加载,顺序为:
APP->EXC->BOOT(最终执行)
找不到然后一级一级向下查找
BOOT->EXC->APP
1.类加载器收到类加载的请求 Application
2.将这个请求向上委托给父类加载器去完成,一直向上委托,直到启动类加载器
3.启动类加载器检查是否能够加载这个类,能加载就结束,使用当前的加载器,否则就抛出异常(class not found异常),通知子类加载器进行加载
4.重复步骤3
五.沙箱安全机制
Java安全模型的核心就是Java沙箱(sandbox),什么是沙箱?沙箱是一个限制程序运行的环境。沙箱机制就是将Java 代码限定在虚拟机(JVM)特定的运行范围中,并且严格限制代码对本地系统资源访问,通过这样的措施来保证对代码的有效隔离,防止对本地系统造成破坏。沙箱主要限制系统资源访问,那系统资源包括什么?CPU、内存、文件系统、网络。不同级别的沙箱对这些资源访问的限制也可以不一样。
所有的Java程序运行都可以指定沙箱,可以定制安全策略。
在Java中将执行程序分成本地代码和远程代码两种,本地代码默认视为可信任的,而远程代码则被看作是不受信的。对于授信的本地代码,可以访问一切本地资源。而对于非授信的远程代码在早期的Java实现中,安全依赖于沙箱(Sandbox)机制。如下图所示 JDK1.0安全模型
但如此严格的安全机制也给程序的功能扩展带来障碍,比如当用户希望远程代码访问本地系统的文件时候,就无法实现。因此在后续的 Java1.1 版本中,针对安全机制做了改进,增加了安全策略,允许用户指定代码对本地资源的访问权限。如下图所示 JDK1.1安全模型
在java1.2 版本中,再次改进了安全机制,增加了代码签名。不论本地代码或是远程代码,都会按照用户的安全策略设定,由类加载器加载到虚拟机中权限不同的运行空间,来实现差异化的代码执行权限控制。如下图所示JDK1.2安全模型
当前最新的安全机制实现,则引入了域 (Domain) 的概念。虚拟机会把所有代码加载到不同的系统域和应用域,系统域部分专门负责与关键资源进行交互,而各个应用域部分则通过系统域的部分代理来对各种需要的资源进行访问。虚拟机中不同的受保护域(Protected Domain),对应不一样的权限(Permission)。存在于不同域中的类文件就具有了当前域的全部权限,如下图所示 最新的安全模型(jdk 1.6)
组成沙箱的基本组件
-
字节码校验器(bytecode verifier):确保Java类文件遵循Java语言规范.这样可以帮助Java程序实现内存保护。但并不是所有的类文件都会经过字节码校验,比如核心类。
-
类装载器(class loader):其中类装载器在3个方面对Java沙箱起作用
- 它防止恶意代码去干涉善意的代码;
- 它守护了被信任的类库边界;
- 它将代码归入保护域,确定了代码可以进行哪些操作。
虚拟机为不同的类加载器载入的类提供不同的命名空间,命名空间由一系列唯一的名称组成,每一个被装载的类将有一个名字,这个命名空间是由Java虚拟机为每一个类装载器维护的,它们互相之间甚至不可见。
类装载器采用的机制是双亲委派模式。
- 从最内层JVM自带类加载器开始加载,外层恶意同名类得不到加载从而无法使用;
- 由于严格通过包来区分了访问域,外层恶意的类通过内置代码也无法获得权限访问到内层类,破坏代码就自然无法生效。
存取控制器(access controller):存取控制器可以控制核心API对操作系统的存取权限,而这个控制的策略设定,可以由用户指定。
安全管理器 (security manager):是核心API和操作系统之间的主要接口。实现权限控制,比存取控制器优先级高。
安全软件包(security package):java.security下的类和扩展包下的类,允许用户为自己的应用增加新的安全特性,包括:
- 安全提供者
- 消息摘要
- 数字签名
- 加密
- 鉴别
六.Native
凡是带了native关键字的,说明Java的作用范围达不到了,会去调用底层C语言的库
进入本地方法栈(如下图红线所示)
调用本地方法接口:JNI(Java Native Interface)
JNI的作用:扩展Java的使用,融合不同的编程语言为Java所用,它在内存中专门开辟了一块标记地区 本地方法栈(Native Method Stack ),为了登记 native方法
在最终执行的时候,加载本地方法库中的方法通过JNI
七.PC寄存器
程序计数器:Program Counter Register
每个线程都有一个程序计数器,是线程私有的,就是一个指针,指向方法区中的方法字节码(用来存储指向一条指令的地址,也即将要执行的指令代码),在执行引擎读取下一条指令,是一个非常小的内存空间,几乎可以忽略不计
八.方法区
Method Area方法区
方法区是被所有线程共享,所有字段和方法字节码,以及一些特殊方法,如构造函数,接口代码也在此定义,简单说,所有定义的方法的信息都保存在该区域,此区域属于共享区间;
静态变量 Static、常量 Final、类信息Class (构造方法、接口定义)、运行时的常量池存在方法区中,但是 实际变量存在堆内存中,和方法区无关
九.栈
是一种数据结构, 先进后出,后进先出,类似一个桶 进叫做压栈,出叫做弹栈
队列:先进先出(FIFO:First Input First Output),类似一个管道
栈:栈内存,主管程序的运行,生命周期和线程同步;
栈不存在垃圾回收问题
栈内存一些什么东西呢:8大基本类型、对象引用、实例的方法
栈运行原理:栈帧 线程每调用一个方法,就会有一个栈帧入栈
堆 栈 方法区的交互关系:
十.三种JVM
JVM有三个公司,分别是:
Sun 公司 HotSpot
BEA JRockit
IBM Technology for Java Virtual Machine 简称IBM J9VM
我们学习的都是 HotSpot
查看自己电脑使用的jvm虚拟机:
十一.堆 Heap
一个JVM只有一个堆内存,堆内存的大小是可以调节的
类加载器读取了类文件后,一般会把什么东西放到堆中?类 方法 常量,变量,保存我们所有引用类型的真实对象.
堆内存中还要细分为三个区域:
- 新生区(伊甸园区) Young/New
- 老年区(养老区) old
- 永久区Perm (JDK1.8后更改名为元空间)现以1.6版本讲解
十二.新生区,老年区
新生区:对象诞生成长的地方
-
伊甸园区(Eden):所有对象都从这里诞生
-
幸存区(Survivor)细分为:(SurvivorFrom->form区,SurvivorTo->to区)
form区:上一次GC的幸存者,作为这一次GC的被扫描者
to区:保留了一次MinorGC过程中的幸存者
在发生一次轻GC后,from区就会和to区互换。在发生轻GC时,Eden区和SurvivorFrom区会把一些仍然存活的对象复制进SurvivorTo区,并清除内存。SurvivorTo区会把一些存活得足够旧的对象移至年老代。 -
老年区
老年区:主要存放应用程序中生命周期长的内存对象。当老年区容量满的时候,会触发重GC(full GC)
十三.永久区
这个区域常驻内存,用来存放JDK自身携带的Class对象.interface元数据,存储的是Java运行时的一些环境,这个区域不存在垃圾回收,关闭JVM虚拟机就会释放这个区域的内存.
当一个启动类,加载了大量的第三方jar包.tomcat部署了太多的应用,大量动态生成的反射类,不断的被加载就可能出现OOM
- jdk1.6之前:永久存储区,常量池在方法区中
- jdk1.7:永久存储区,常量池在堆中,进行去永久区策略
- jdk1.8:永久区消失,以元空间取代
十四.堆内存调优
public class Demo01 {
public static void main(String[] args) {
//返回虚拟机试图使用的最大内存
long max = Runtime.getRuntime().maxMemory(); //显示字节
//返回jvm的初始化内存
long total = Runtime.getRuntime().totalMemory();
System.out.println("max="+max+"字节=\t"+(max/(double)1024/1024)+"MB");
System.out.println("total="+max+"字节=\t"+(total/(double)1024/1024)+"MB");
//遇到OOM异常如何解决:
//1.尝试扩大堆内存
//2.分析内存,观察那里出现问题,手动调用GC
}
}
在内存分配问题上,元空间在本地内存中,并没有在JVM内存中,所以JVM内存=新生区内存+老年区内存
在一个项目中,突然出现了OOM故障,那么该如何排除,研究为什么出错
- 能够看到代码第几行出错,内存快照分析工具,MAT,Jprofiler
- Debug 一行行分析代码
TAT,Jprofiler作用:
- 分析Dump内存文件,快速定位内存泄露
- 获得堆中的数据
- 获得大的对象
-Xms :设置初始分配大小,默认为物理内存的 “1/64”。
-Xmx :最大分配内存,默认为物理内存的 “1/4”。
-XX:+PrintGCDetails :输出详细的GC处理日志。
详情参考:狂神说Java
十五.GC
JVM在进行垃圾回收时:并不是对这三个区域统一回收,大部分时间都是回收新生代(伊甸园区)
假设内存满了,OOM,堆内存不足
GC两种分类:
- 轻GC(GC)
当Eden区内存不够的时候就会触发MinorGC,对新生区进行一次垃圾回收。
重GC(Full GC)
当老年区容量满的时候,会触发重GC(full GC)
GC的算法有哪些:标记清除法,标记整理,复制算法,引用计数器,怎么用的
1.常用算法
-
引用计数器
我们一般也称呼引用计数垃圾收集为直接的垃圾收集机制,它只需要一个简单的递归即可实现,现代编程语言比如Lisp,Python,Ruby等的垃圾收集算法采用的就是引用计数算法引用计数算法很简单,它实际上是通过在对象头中分配一个空间来保存该对象被引用的次数。如果该对象被其它对象引用,则它的引用计数加一,如果删除对该对象的引用,那么它的引用计数就减一,当该对象的引用计数为0时,那么该对象就会被回收。
-
复制算法
在发生一次轻GC后,from区就会和to区互换。在发生轻GC时,Eden区和SurvivorFrom区会把一些仍然存活的对象复制进SurvivorTo区,并清除内存。SurvivorTo区会把一些存活得足够旧的对象移至年老代。
空的那个幸存者区就是to区优点:
- 没有标记和清除过程,实现简单,运行高效。
- 复制过去以后保证空间的连续性,不会出现“碎片”问题。
缺点:
- 需要两倍的内存空间。
- 需要维护对象之间的引用关系,不管是内存占用或者时间开销也不小。
复制算法最佳使用场景:对象存货度较低的时候
-
标记清除算法
首先标记出所有需要回收的对象,在标记完成后统一回收掉所有被标记的对象。在标记阶段,会遍历所有 GC ROOTS,将所有 GC ROOTS 可达的对象标记为存活。只有当标记工作完成后,清理工作才会开始。优点:
- 不需要额外空间
缺点:
- 效率问题:标记和清除过程的效率都不高;
- 空间问题:标记清除之后会产生大量不连续的内存碎片,空间碎片太多可能会导致,碎片过多会导致大对象无法分配到足够的连续内存,从而不得不提前触发GC,甚至Stop The World。
-
标记整理算法
标记整理法与标记清除法首先是一样的,先判断时候被GC Root引用,再进行标记,不同的是第二步,标记整理法对对象进行了整理,使内存更紧凑,从而没有产生内存碎片。
优点:没有内存碎片
缺点:速度较慢,因为牵扯到对象地址的移动
十六.总结
内存效率:复制算法> 标记清除算法>标记整理算法
内存整齐度:复制算法=标记压缩算法>标记清除算法
内存利用率:标记压缩算法=标记清除算法>复制算法
所以没有最好的算法,只有最合适的算法
GC又被称为:分代收集算法
年轻代:
- 存活率低->复制算法
老年代:
- 区域大 存活率高->标记清除(内存碎片不多)+标记整理混合实现