一什么是JVM?
1.虚拟机概述:
虚拟机(Virtual Machine)指通过软件模拟的具有完整硬件系统功能的、运行在一个完全隔离环境中的完整计算机系统。通俗的讲就是用软件模拟的一台物理机,生成现有操作系统的全新虚拟镜像,然后在操作系统上运行。
很多时候,在我们需要用到多台电脑的时候,但是手头紧,就可以使用虚拟机模拟出新的电脑去使用。
常用的虚拟机有VMWare(一般多用模拟linux系统),Virtual Box(做App的模拟),Java Virtual Machine(JVM)
2.JVM概述:
JVM是Java Virtual Machine(Java虚拟机)的缩写,JVM是一种用于计算设备的规范,它是一个虚构出来的计算机,是通过在实际的计算机上仿真模拟各种计算机功能来实现的。你可以这样理解:JVM是以java字节码(class文件)为机器码的物理机。java通过它实现了一次编译、到处运行的流氓行为,任何机器上只要装了JVM,我都可以把编译打包好的java代码放上去完美运行。
3.常用JVM:
常用的JVM有Sun HotSpot VM、BEA JRockit VM、IBM J9 VM、Azul VM、Apache Harmony、Google Dalvik VM、Microsoft JVM,JVM提供商包括Sun、BEA、 IBM等。1999 年,Sun公司发布了由CIC++実現的HotSpotJava虚似机。2006年,在JavaOne大会.上开源了其相关核心技术,启用OpenJDK项目,逐歩形成了活跃的OpenJDK社区。2010年, Sun公司被Oracle公司收鈎。Oracle 的HotSpot JVM实现,是目前OpenJDK使用的主流JVM,它采用解释预编译混合执行的模式,其JIT 技木采用分层编译,板大地提升了Java的抗行速度; BEA的JRockit在2008年被并入HotSpot; IBM的J9也在2017年开源,形成了现在的OpenJ9社区。
二.JVM的内部结构
如下图所示
通俗点理解我们可以把他们3者的关系看成是,CPU(执行引擎),内存(运行时数据区),文件系统驱动(类加载器),首先由文件系统的驱动(类加载器)去读取文件,存入内存(运行时数据区)中,CPU(执行引擎)通过和内存(运行时数据区)交互,得到计算结果。
三.JVM的内存结构
1.内存结构:
java设计规范中把运行时数据区分成了五个部分,分别是程序计数器,Java栈,本地方法栈,Java堆以及方法区,如下图:
2.功能:
图片来自于 https://juejin.im/post/5ccfa05af265da039f0f243b
程序计数器(线程私有):是一个指针,指向下一条指令的地址,也就是告诉执行引擎,该线程下一步要执行的指令,需要空间很小
虚拟机栈(线程私有):Java线程执行方法的内存模型,一个线程对应一个栈,用于存储java方法中的私有数据,比如基础数据类型的对象和自定义对象的引用(不是对象),它的生命周期和线程一致。只要线程一结束该栈就会释放,不需要垃圾回收。
本地方法栈(线程私有):和Java栈类似,本地方法(native方法),也就是早期用C/C++实现的方法也有栈,在Execution Engine执行时加载本地方法库
堆区(线程共有):存储那些对于占用地址较大,创建成本比较高的数据,也就是我们所创建的对象
方法区(线程共有):类的所有字段和方法字节码,以及一些特殊方法如构造函数,接口代码也在此定义。简单说,所有定义的方法的信息都保存在该区域,是类加载器存储class文件信息的地方,静态变量+常量+类信息(构造方法/接口定义)+运行时常量池都存在方法区中。
大家可以发现,这里面提到了线程私有和线程共有,指的是对于每一个新的线程,都会创建一个程序技术器、java栈和本地方法栈,一旦线程结束,这些都会被销毁,而java堆和方法区只有在所有的线程都执行完的时候才会被销毁的。
3.栈模型:
栈,是一个先进先出的数据结构。在java栈内,会对每一个执行到的java方法都会创建一个栈帧,放入栈内,一旦栈帧执行完毕就会出栈,继续执行最外层的栈帧,直到所有的栈帧都出栈了,线程也就执行完毕了。
对于每一个栈帧,里面都有4个部分,分别是局部变量表、操作数栈、动态链接以及返回地址;
局部变量表:记录当前方法参数以及内部定义的局部变量
操作数栈:记录当前的操作数
动态链接:表示对内部方法的调用,无法在类加载阶段或第一次使用时直接确定的,由每一次调用所确定方法引用,称之为动态链接
返回地址:方法结束,返回上层方法以及恢复上层方法执行状态所需的信息
3.堆模型:
为了能够更好的对对象进行垃圾回收,java设计对堆进行了分代,这样可以方便对存活时间不同的对象进行处理,分成了2个部分:
(a).年轻代:用于存放新产生的对象。年轻代分为两部分: 伊甸区(Eden space)和幸存者区(Survivor pace) 。所有的类都是在伊甸区被new出来的。幸存区有两个: 0区(Survivor 0 space)和1区(Survivor 1 space)。当伊甸区的空间用完时,程序又需要创建对象,JVM的垃圾回收器将对伊甸区进行垃圾回收(Minor GC),将伊甸园区中的不再被其他对象所引用的对象进行销毁。然后将伊甸园中的剩余对象移动到幸存 0区。若幸存 0区也满了,再对该区进行垃圾回收,然后移动到1区,如果还是满了,就到老年代。
(b).老年代:用于存放被长期引用的对象。新生区经过多次GC仍然存活的对象移动到老年区。若老年区也满了,那么这个时候将产生MajorGC(FullGC),进行老年区的内存清理。若老年区执行了Full GC之后发现依然无法进行对象的保存,就会产生OOM异常“OutOfMemoryError。
Major GC 清理年老区(Tenured space).
Full GC 清理整个内存堆 – 既包括年轻代也包括年老代.
3.方法区:
虽然Java虚拟机规范把方法区描述为堆的一个逻辑部分,但是它却有一个别名叫做 Non-Heap(非堆),目的应该是与 Java 堆区分开来。所以这一部分我也就单独拿出来说明了。
可能大家对这一个名字听的不是很多,但可能大家听过永久代或持久代的会更多一点,永久代是HotSpot JVM 在java8之前对方法区的实现,这个名称也是相对年轻代和老年代来说,他们的FullGC也会对永生代进行垃圾回收。
在java8之后,永久代被代替了,换成了元空间区,两者本质都是对JVM规范中方法区的实现,区别在于元数据区并不在虚拟机中,而是使用本地物理内存,这样的话,方法区的大小也就不那么容易收到限制,而永久代在虚拟机中,永久代逻辑结构上属于堆,但是物理上不属于堆,堆大小=新生代+老年代。元数据区也有可能发生OutOfMemory异常,
元数据区的动态扩展,默认–XX:MetaspaceSize值为21MB的高水位线。一旦触及则Full GC将被触发并卸载没有用的类(类对应的类加载器不再存活),然后高水位线将会重置。新的高水位线的值取决于GC后释放的元空间。如果释放的空间少,这个高水位线则上升。如果释放空间过多,则高水位线下降。
参考文章:微信公众号:互联网架构师学习之路: Java核心篇-JVM内存模型