文章目录
Java与C++的一个重要区别就是 内存动态分配和 垃圾回收机制,在 虚拟机自动内存管理机制的帮助下,Java程序员不需要为每一个new操作去写配对的delete/free代码,不容易出现 内存泄漏和 内存溢出的问题。不过,如果不了解虚拟机是怎样使用内存的, 那么排查错误就会成为一项非常艰辛的工作。
运行时数据区域
Java虚拟机在执行Java程序时会把它所管理的内存划分为若干个不同的数据区域:
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190731225905415.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQ0MjM4MTQy,size_16,color_FFFFFF,t_70)
程序计数器
-
程序计数器可以看做是当前线程所执行的字节码的行号指示器。
-
字节码指示器通过改变这个计数器的值来选取下一条需要执行的字节码指令,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成。
-
线程私有。Java虚拟机的多线程是通过线程轮流切换并分配处理器执行时间的方式来实现,在任何一个确定的时刻,一个处理器(或者是多核处理器的一个内核)都只会执行一条线程中的指令。为了保证线程切换后能够恢复到正确的执行位置,每个线程之间都需要有一个独立的程序计数器,各个线程之间互不影响。
-
当前线程执行的方法不同,程序计数器所记录的数据不同:
线程执行Java方法,程序计数器记录的就是正在执行的虚拟机字节码指令的地址。
线程执行Native方法(Java调用非Java语言的方法),程序计数器值为空(Undefined)。
-
唯一一个没有规定任何OutOfMemoryError情况的区域。
Java虚拟机栈
-
Java虚拟机栈是线程私有的,它的生命周期和线程相同。
-
栈帧(Stack-Frame):Java方法执行的内存模型,用于存储局部变量表、操作数栈、动态链接、方法出口等信息。每一个方法从调用到执行完成的过程,对应着一个栈帧在虚拟机栈中入栈和出栈的过程。
-
栈帧中的局部变量表存放了编译期已知的各种基础数据类型、对象引用(reference类型)和returnAdress类型(执行某条字节码指令的地址)。
-
64位长度的long和double类型的数据会占用2个局部变量空间(Slot),其余数据类型占用1个。
-
栈帧中的局部变量表所需要的内存空间是在编译期间完成分配的,当进入一个方法时,这个方法需要在帧中分配多大的局部变量空间是完全确定的,在方法运行期间不会改变局部变量表的大小。
-
在Java虚拟机规范中,Java虚拟机栈被规定了两种异常情况:
如果线程请求的栈深度大于虚拟机所允许的栈深度,将抛出StackOverflowError异常;
如果虚拟机动态扩展无法申请到足够的内存,就会抛出OutOfMemoryError异常。
本地方法栈
- 本地方法栈与虚拟机栈所发挥的作用非常相似:虚拟机栈为Java方法服务,本地方法栈为Native方法服务。
- 不同的虚拟机对于本地方法栈的实现不同,甚至可以与虚拟机栈合二为一。
- 和虚拟机栈一样,也会抛出StackOverflowError和OutOfMemoryError异常。
Java堆
-
线程共享,Java-Heap是虚拟机所管理的内存中最大的一块,,在虚拟机启动时创建。
-
Java堆的唯一目的:存放对象实例。所有对象实例和数组都要在堆上分配内存。
-
Java堆是垃圾收集器管理的主要区域,多数时也被称做“GC堆”(Garbage Collected Heap)。
-
Java堆可以处于物理上不连续的内存空间中,只要逻辑上是连续的即可。
-
Java堆在实现时,可以设置成固定大小的,也可以设置为可扩展的。
-
如果堆中没有内存完成实例分配,并且堆也无法再扩展时,就会抛出OutOfMemoryError异常。
方法区
- 线程共享,是堆的一个逻辑部分,别名叫Non-Heap(非堆),也叫静态区。
- 用于存储已被虚拟机加载的类信息(Class文件)、常量、静态变量、静态方法、即时编译器编译后的代码等数据等。
- 方法区内存回收的主要目标是针对常量池的回收以及类型的卸载。
- 根据Java虚拟机规范的规定,如果方法区无法满足内存分配需求时,将抛出OutOfMemoryError异常。
运行时常量池
- Runtime Constant Pool是方法区的一部分,Class文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池。Class文件中的常量池用于存放编译期生成的各种字面量和符号引用,这部分内容将在类加载后进入方法区的运行时常量池中存放。
- 运行时常量池并没有被Java虚拟机规范做任何细节上的要求,不同提供商的虚拟机可以按照自己的需求来实现这一块内存区域。
- 运行时常量池具备动态性:存放进Class文件的常量池的常量是在编译期产生的,类加载后进入运行时常量池,而对于在运行时产生的常量,也是有可能进入运行时常量池的。
- 既然运行时常量池是方法区的一部分,自然受到方法区的限制,当常量池无法再申请到内存时将会抛出OutOfMemoryError异常。
直接内存
- Direct Memeoy 并不是虚拟机运行时数据区的一部分,也不是Java虚拟机规范中定义的内存区域。
- JDK1.4加入了NIO(New Input/Output)类,引入了一种基于通道(Channel)与缓冲区(Buffer)的I/O方式。它可以使用Native函数库直接分配堆外内存,然后通过一个存储在Java堆中的DirectByteBuffer对象作为这块内存的引用进行操作。这样做可以显著提升性能,因为避免了在Java堆和Native堆中来回复制数据。
- 会抛出OutOfMemoryError异常。
对象
对象的创建
Java是一门面向对象的语言,正所谓“万物皆对象”,程序的运行过程中会有相当多的对象被创建。从语言层面上看,我们仅仅是使用了一个new关键字而已,但是虚拟机究竟是如何处理这个对象的创建呢?
- 类加载检查
当虚拟机收到new指令时,首先会去检查这个指令的参数是否能在方法区的运行时常量池中定位到一个类的符号引用,并检查这个符号引用代表的类是否已经被加载,解析并初始化过。如果没有就执行相应的类加载过程。 - 分配内存
类加载检查通过后,虚拟机开始从堆中为这个新对象分配内存。对象所需要的内存大小在类加载之后确定下来的。从堆中划分一定的内存给新对象有两种方式,一种是“指针碰撞”,一种是“空闲列表”。采用哪种分配方式由Java堆是否规整决定,Java堆是否规整又由垃圾收集器是否带有压缩整理功能决定。
划分内存时还需要考虑的一个问题是线程安全。解决这个问题有两种方案:一种是对分配内存空间的动作进行同步处理——实际上虚拟机采用的CAS配上失败重试的方式可以保证更新操作的原子性;另一种是把内存分配的动作按照线程划分在不同的空间内进行,即每个线程都预先在Java堆中分配一小块内存用于该线程下的对象内存分配,这一小块内存称之为本地线程分配缓冲(Thread Local Allocation Buffer,TLAB)。哪个线程需要分配内存,就在自己的TLAB下分配,只有TLAB用完分派新的TLAB时才需要同步操作。是否使用TLAB,可以通过-XX:+/-UseTLAB参数设置。 - 赋初始化值
内存分配完之后,虚拟机需要为刚分配到的内存空间初始化为零值(不包括对象头)。这么做的必要性在于保证代码中对象的实例字段可以不用赋初始值就可以使用,程序能访问到这些字段的数据类型所对应的零值。 - 对象设置
赋值结束后,虚拟机需要对这个对象进行一些必要的设置,比如这个对象是哪个类的实例,如何能找到这个了类元数据信息,对象的哈希码,对象的GC分代年龄等信息。这些信息存放在对象的对象头(Object Header)之中。 - init方法的执行
一般来说(有字节码中是否跟随invkoespecial指令决定),执行new指令后都会去执行init方法把对象按照程序员的要求进行初始化,给对象的属性赋值。
对象的内存布局
对象在内存中存储的布局可以分为三块区域:对象头(Header)、实例数据(Instance Data)和对齐填充(Padding)。
对象头中主要包含两部分信息:
-
用于存储对象自身的运行时数据(哈希码,GC年龄,锁状态标志,线程锁)
-
类型指针(对象指向它的类元数据的指针,用来确定这个对象是哪个类的实例)
-
如果对象是一个Java数组,那么对象头中还必须有一块用于记录数组长度的数据。因为虚拟机可以通过普通Java对象的元数据信息确定Java对象的大小,但是从数组的元数据中却无法确定数组的大小。
实例数据部分是对象真正存储的有效信息,也是在程序代码中所定义的各种类型的字段内容。这其中包括从父类继承下来的和在子类中定义的。这部分的存储数据的顺序受到虚拟机分配策略参数(FieldsAllocationStyle)和字段在Java源码中定义的顺序的影响。一般来说,相同宽度的字段总是分配到一起,而且父类中定义的变量会在子类之前。
对齐填充并不是必须存在的,只起到占位符的作用(虚拟机的自动内存管理系统要求对象起始地址必须是8字节的整数倍)。
对象的访问定位
我们已经知道栈中存放的是Java方法执行的内存模型——栈帧,栈帧中的局部变量表其中有一项就是reference类型,而Java程序是通过栈上的reference数据来操作对堆中的具体对象的。
reference类型在Java虚拟机规范中只规定了一个指向对象的引用。具体的实现有两种方式:
-
通过句柄访问对象:堆中划分一片内存给句柄池,reference类型存储句柄地址,句柄中保存对象实例数据和类型数据各自的地址信息。
-
直接指针访问:reference中存储的直接就是对象实例数据的地址信息,由Java堆负责访问对象类型数据的相关信息。
- 总结
- 句柄访问的优势在于reference中存储的是稳定的句柄地址,在对象被移动后只需要改变句柄中的实例数据指针,reference指针本身不用被修改
- 直接指针访问的优势在于更快的执行速度,节省了一次指针定位的时间开销。
Sun JDK和OpenJDK中使用的HotSpot VM是目前使用最为广泛的虚拟机(尽管它最初并不是Sun公司研发出来的),HotSpot VM使用的是直接指针访问对象。句柄访问在各种语言和框架更为常见。
OutOfMemoryError
除了程序计数器以外,其他几个运行时区域都会发生OutOfMemoryError(简称OOM)。对于这种错误有必要知道如何避免以及如何处理这种异常。
Java堆溢出
Java堆用于存储对象实例,只要不断地创建对象,并保证GC Roots到对象之间有可达路径来避免垃圾回收机制清除这些对象,那么在对象数量达到最大堆的容量限制后就会产生内存溢出异常:java.lang.OutOfMemoryError: Java heap space
。
解决堆溢出要先使用内存镜像分析工具(比如Eclipse Memory Analyser)对Dump出的堆转存快照进行分析,重点是确认内存中的对象是否都是有必要的,也就是要先分清楚到底是内存泄漏(Momery Leak)还是内存溢出(Memory Overflow)。
如果是内存泄漏,就要进一步通过工具查看泄漏对象到GC Roots的引用链,找到泄漏对象是通过怎样的路径与GC Roots相关联并导致垃圾收集器无法自动回收它们的原因。掌握了泄漏对象的类型信息以及GC Roots引用链的信息,就可以比较准确地定位出泄漏代码的位置。
如果是内存溢出,那就意味着内存中的对象确实是有必要都必须存活着,此时应当检查虚拟机的堆参数(-Xmx与-Xms),和机器物理内存对比看是否还可以继续调大。从代码上检查是否存在某些对象生命周期过长,持有状态时间过长的情况,尝试减少程序运行期的内存消耗。
栈溢出
HotSpot虚拟机中并不区分Java虚拟机栈和本地方法栈。可以通过-Xss参数设定栈容量。在Java虚拟机规范中,Java虚拟机栈被规定了两种异常情况:
- 如果线程请求的栈深度大于虚拟机所允许的栈深度,将抛出StackOverflowError异常;
- 如果虚拟机动态扩展时无法申请到足够的内存,就会抛出OutOfMemoryError异常。
这里把异常分为两种情况,看似严谨,实际却并非这样:当栈空间无法继续分配时,到底是内存太小,还是已使用的栈空间太大,其本质上是对同一件事的两种叙述而已。
实际上,在单个线程下,无论是由于栈帧太大还是虚拟机栈容量太小,当内存无法继续分配时,虚拟机抛出的都是StackOverflowError异常。
如果是多线程开发,倒是可以产生OutOfMemoryError异常,不过这样产生的OOM与栈空间是否足够大并不存在任何联系。
开发多线程时,出现StackOverflowError异常时有错误堆栈可以阅读,相对来说比较容易找到问题所在。而且使用虚拟机默认参数的情况下栈深度达到1000~2000完全没有问题,足够正常的方法调用。但是,如果是建立多线程导致的内存溢出,在不能减少线程数的情况下,就只能通过减少最大堆和减少栈容量来换取内存。
方法区溢出
方法区用于存放Class的相关信息,如类名、常量池、字段描述、方法描述等。如果运行时产生大量的类填满了方法区,就会产生内存溢出的异常。
方法区溢出是一种常见的内存溢出异常。一个类要想被垃圾回收器回收,判定条件是十分严苛的。在经常动态生成大量Class的应用中,需要特别注意的类的回收状况。常见的场景有:使用CGLib字节码增强和动态语言,大量JSP或动态产生JSP文件的应用(JSP第一次运行时需要编译为Java类),基于OSGi的应用等。
-
全文完。
-
文中大部分内容摘抄自《深入理解Java虚拟机》第二章,系个人总结。