此为《分布式Java应用》一书中有关JVM内存管理和垃圾回收的章节笔记。
了解JVM的内存分配和回收机制,可以更加准确地判断程序的运行状况及进行性能的调优。
JVM内存空间
JVM将内存空间分为方法区、堆、本地方法栈、PC寄存器及JVM方法栈。
方法区
方法区存放了加载类的信息、类中的静态变量、类中定义为final类型的常量,通过Class对象的getName等方法来获取信息时,这些数据都来源于方法区。JVM方法区在JDK中对应Permanet Generation(持久代)。
堆
堆中储存的是对象实例和数组。开发人员可以设置堆的扩容策略。JDK1.2开始对堆采用分代管理的方式。堆内存是内存中最重要的一块,也是最有必要进行深究的一部分。因为Java性能的优化,主要就是针对这部分内存的。可通过-Xms和-Xmx控制JVM启动时申请的最小和最大Heap内存。
新生代(堆)
多数情况下Java程序中新建的对象都从新生代分配内存。新生代有Eden Space和两块Survivor构成。不同的GC方式会以不同的方式来划分Eden Space和Survivor Space。
旧生代(堆)
用于存放新生代中经过多次垃圾回收仍然存货的对象。如果新建的对象时大对象或大数组对象,那也有可能在旧生代直接分配内存。
本地方法栈
用于存储每个native方法的调用状态,在JDK的实现中本地方法栈和JVM方法栈是同一个。
JVM方法栈
JVM虚拟机栈就是堆栈的栈,它的生命周期和线程一样,每个方法被执行的时候会产生一个栈帧,用于存储局部变量表、动态链接、操作数、方法出口等信息。方法的执行过程就是栈帧在JVM中出栈和入栈的过程。局部变量表中存放的是各种基本数据类型及引用类型(存放的是指向各个对象的内存地址),因此,它有一个特点:内存空间可以在编译期间就确定,运行期不再改变。这个内存区域会有两种可能的Java异常:StackOverFlowError和OutOfMemoryError。
Java垃圾回收机制
GC首先找到程序中不再被使用的对象,然后回收这些对象所占用的内存。JDK采用根搜索算法找到这些对象。基本思想:从GC Roots的对象开始,向下搜索,如果一个对象不能到达GC Roots对象的时候,说明它已经不再被引用,即可被进行垃圾回收(事实,当一个对象不再被引用时,如果类重写了finalize()方法,且没有被系统调用过,那么系统会调用一次finalize()方法,以完成最后的工作,在这期间,如果可以将对象重新与任何一个和GC Roots有引用的对象相关联,则该对象可以“重生”,如果不可以,那么就说明彻底可以被回收)。
通常采用收集器的方式实现GC。
跟踪收集器
收集器采用的为集中式的管理方式,全局记录数据的引用状态。基于一定条件的出发,执行时需要从根集合来扫描对象的引用关系,主要有赋值、标记-清除(Mark-Sweep)和标记-压缩(Mark-Compact)三种实现算法。
标记-清除算法(Mark-Sweep)
最基础的GC算法,将需要进行回收的对象做标记,之后扫描,有标记的进行回收,这样就产生两个步骤:标记和清除。这个算法效率不高,而且在清理完成后会产生内存碎片,这样,如果有大对象需要连续的内存空间时,还需要进行碎片整理,所以,此算法需要改进。
复制算法(Copying)
新生代内存分为三份,Eden区和2块Survivor区,一般JVM会将Eden区和Survivor区的比例调为8:1,保证有一块Survivor区是空闲的,这样,在垃圾回收的时候,将不需要进行回收的对象放在空闲的Survivor区,然后将Eden区和第一块Survivor区进行完全清理。如果第二块Survivor区的空间不足,就需要暂时借持久代的内存用。此算法适用于新生代。
标记-压缩算法(Mark-Compact)
和标记-清除算法前半段一样,只是在标记了不需要进行回收的对象后,将标记过的对象移动到一起,使得内存连续,这样,只要将标记边界以外的内存清理就行了。此算法适用于持久代。
Java垃圾回收相关方法
gc()
调用gc 方法提示JVM来回收未用对象,以便能够快速地重用这些对象当前占用的内存。当控制权从方法调用中返回时,虚拟机已经尽最大努力从所有丢弃的对象中回收了空间,调用System.gc() 等效于调用Runtime.getRuntime().gc()。
finalize()的调用及重写
gc 只能清除在堆上分配的内存(纯java语言的所有对象都在堆上使用new分配内存),而不能清除栈上分配的内存(当使用JNI技术时,可能会在栈上分配内存,例如java调用c程序,而该c程序使用malloc分配内存时)。因此,如果某些对象被分配了栈上的内存区域,对栈上的对象进行内存回收就要靠finalize()。