一、什么是JVM
JVM是java虚拟机(Java Virtual Machine),其实现了“一次编译,处处运行”的功能。JVM是运行在操作系统之上的,它与硬件没有直接的交互。
二、JVM的内存划分
首先解释两个概念:
(1)线程公有
在运行时数据区中,方法区和堆是属于线程公有的,也就是这两块区域是“循环利用”的,所以要对其进行垃圾回收。其是在虚拟机启动时创建。
(2)线程私有
虚拟机栈、本地方法栈、程序计数器是属于线程私有的,其与线程“同生死”,属于“一次性”的,所以不用对其进行垃圾回收。
JVM的内存大概分为:类装载器子系统、运行时数据区、执行引擎、本地方法接口,下面分别介绍。
1、类装载器:
负责加载class文件,class文件在文件开头有特定的文件标示,并且ClassLoader只负责class文件的加载,至于它是否可以运行,则由执行引擎Execution Engine决定。
2、运行时区域:
(1)方法区:是各个线程共享的区域,用于存储已经被虚拟机加载的类信息、常量、静态变量、及时编译器编译后的代码等数据。运行时常量池存在方法区中。
(2)堆:
对于大多数应用来说,Java堆(Java Heap)是Java虚拟机所管理的内存中最大的一块。Java堆是被所有线程共享的一块内存区域,在虚拟机启动时创建。用于存放对象实例,几乎所有的对象实例都在这里分配内存。
Java堆是垃圾收集器管理的主要区域。堆内存分为三个部分:新生区+养老区+永久区。物理上只有新生代+老年代。新生代又可以分为伊甸区+幸存区0+幸存区1。Java8把永久区换成了元空间。
JDK1.6及之前:有永久代,常量池1.6在方法区。
JDK1.7:有永久代,但已经逐步“去永久代”,常量池1.7在堆。
JDK1.8及之后:无永久代,常量池1.8在元空间。
虽然JVM规范将方法区描述为堆的一个逻辑部分,但它却还有一个别名叫做Non-Heap(非堆),目的就是要和堆分开。对于HotSpot虚拟机,很多开发者习惯将方法区称之为“永久代(Parmanent Gen)” ,但严格本质上说两者不同,或者说使用永久代来实现方法区而已,永久代是方法区(相当于是一个接口interface)的一个实现,jdk1.7的版本中,已经将原本放在永久代的字符串常量池移走。
(3)Java虚拟机栈:
栈也叫栈内存,主管Java程序的运行,是在线程创建时创建,它的生命期是跟随线程的生命期,线程结束栈内存也就释放,对于栈来说不存在垃圾回收问题,只要线程一结束该栈就Over,生命周期和线程一致,是线程私有的。
虚拟机栈里面存储的是栈帧(Stack Frame),栈帧里面存储的是局部变量表,操作数栈,动态链接,方法出口等信息。每一个方法从调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中入栈到出栈的过程。
局部变量表存放了8种基本数据类型、对象引用和returnAddress类型。其中64位的long和double类型的数据会占用2个局部变量空间(slot),其余的数据类型只占用1个。局部变量表所需的内存空间在编译期间就能完成分配,在运行期间不会改变其大小。
在Java虚拟机规范中,对这个区域规定了两种异常情况:
- 如果线程请求的栈深度大于虚拟机允许的最大深度,将抛出 StackOverflowError异常。(使用的栈空间太大)
- 如果虚拟机在扩展栈时无法申请到足够的内存空间,则抛出 OutOfMemoryError异常。(内存太小)
(4)本地方法栈:
本地方法栈与虚拟机栈所发挥的作用是非常相似的,只不过虚拟机栈是为虚拟机执行java方法服务,本地方法栈则为虚拟机使用到的Native方法服务。Native方法用于调用底层C/C++程序。
(5)程序计数器:
是一块较小的内存空间,它可以看做是当前线程所执行的字节码的行号指示器,是线程私有的。
3、执行引擎:
Execution Engine执行引擎负责解释命令,提交操作系统执行。
4、本地库接口:
它的具体做法是Native Method Stack中登记native方法,在Execution Engine 执行时加载本地方法库。
三、虚拟机对象探秘
1、对象的创建过程
(1)检查new指令的参数是否能在常量池中定位到一个类的符号引用。
(2)检查这个符号引用代表的类是否已被加载、解析和初始化过。如果没有必须先执行相应的类加载过程。
(3)虚拟机为新生对象分配内存,有两种方式,指针碰撞和空闲列表。
(4)将分配到的内存空间初始化为零值。
(5)对对象进行必要的设置,例如这个对象是哪个类的实例,如何才能找到类的元数据信息,对象的哈希码等。这些信息存放在对象的对象头之中。
(6)执行new指令后会接着执行<init>方法,把对象按照程序员的意愿进行初始化。
2、对象的内存布局
对象在内存中的存储布局分为3部分:对象头(Header)+实例数据(Instance Data)+对齐填充(Padding)。
(1)对象头
对象头包括两部分信息:
运行时数据,包括哈希码,GC分代年龄,锁状态标志等。
类型指针,虚拟机通过这个指针来确定这个对象是哪个类的实例。
(2)实例数据
实例数据是对象真正存储的有效信息,也是在程序代码中定义的各种类型的字段内容。
(3)对齐填充
不是必然存在的,仅仅起着占位符的作用。只要保证对象的大小是8字节的整数倍即可。当对象实例数据部分没有对齐时,就需要通过对齐填充来补全。
3、对象的访问定位
目前的主流访问方式有两种:使用句柄和直接指针。
(1)句柄:
如果使用句柄访问的话,java堆中将划分出一块内存来作为句柄池,reference中存储的就是对象的句柄地址,而句柄中包含了对象实例数据和类型数据各自具体的地址信息。
使用句柄的最大好处就是reference中存储的是对象的句柄地址,在对象被移动(垃圾收集时移动是非常普遍的行为)时只会改变句柄中的实例数据指针,而reference本身不需要修改。
(2)直接指针
如果使用直接指针访问,那么Java堆对象的布局中就必须考虑如何放置访问类型数据的相关信息,而reference中存储的直接就是对象地址。
使用直接指针的最大好处就是速度更快,节省了指针定位的时间开销。在HotSpot虚拟机中,使用的是这种方式。