由于程序计数器、虚拟机栈、本地方法栈这3个区域是随线程生灭的,每一个栈帧中分配多少内存基本上是在类结构确定下来时就已知的,因此这几个区域的内存分配和回收都具有确定性,在这几个区域内就不需要过多考虑回收的问题,因为方法结束或者线程结束时,内存自然就随着回收了。Java堆和方法区的回收是我们关注的重点。
1.判断对象是否已死
垃圾收集器在对堆进行回收前,第一件事情就是判断这些对象那些活着,那些已死(即不可能再被任何途径使用的对象)。
1.1 引用计数算法
给对象中添加一个引用计数器,每当一个地方引用它,计数器值加1,当引用失效时,计数器值减1。任何时刻计数器为0的对象就是不可能再被使用的对象。但Java虚拟机里边没有选用引用的计数算法来管理内存,主要是因为它很难解决对象之间的相互循环引用的问题。
下边例子是相互引用,实际上这两个对象已经不可能再被访问,但因为它们互相引用着对方,导致他们计数都不为零,于是引用计数算法无法通知GC来收集它们。
/**
* 使用 -XX:+PrintGCDetails -XX:+PrintGCTimeStamps 来看GC日志
* @author zaimeibian
*
*/
public class ReferenceCountingGC {
public Object instance = null;
private static final int _1MB = 1024*1024;
private byte[] bigSize = new byte[2* _1MB]; //2MB的内存,在GC日志中方便区分
public static void testGC(){
ReferenceCountingGC objA = new ReferenceCountingGC();
ReferenceCountingGC objB = new ReferenceCountingGC();
objA.instance = objB;
objB.instance = objA;
objA = null;
objB = null;
System.gc();
}
public static void main(String[] args) {
testGC();
}
}
程序运行结果为:
Java虚拟机并没有因为这两个对象的互相引用就不回收他们,侧面说明虚拟机并不是通过计数算法来判断对象是否存活的。
1.2 可达性分析算法
主流的商用程序语言,都是通过可达性分析(Reachability Analysis)来判断对象是否存活的。这个算法的基本思路就是通过一系列的称为“GC Roots”的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链(Reference Chain),当一个对象到GC Roots没有任何引用链相连(用图论的话来说,就是从GC Roots到这个对象不可达)时,证明此对象是不可用的。
如图,object5,6,7 这三个对象虽然互相有关联,但是它们到GC Roots是不可达的。
在Java语言中,可以作为GC Roots的对象包括下面几种:
- 虚拟机栈(栈帧中的本地变量表)中引用的对象;
- 方法区中类静态属性引用的对象;
- 方法区中常量引用的对象;
- 本地方法栈中JNI(即一般说的Native方法)引用的对象;
1.3 关于引用
在JDK1.2以后,Java对引用的概念进行了扩充,将引用分为强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Weak Reference)、虚引用(Phantom Reference)4种,引用强度依次减弱。
强引用:指代码之中普遍存在的 Object obj = new Object() 这类的引用,只要强引用还存在,GC永远不会回收掉被引用的对象。
软引用:描述一些还有用但并非必需的对象,对于软引用关联着的对象,在系统将要发生内存溢出异常之前,将会把这些对象列进回收范围之中进行第二次回收,如果这次回收还没有足够的内存,才会抛出内存溢出异常。SoftReference类实现软引用。
弱引用:也是描述非必须对象的,但是它的强度比软引用更弱,只能生存到下一次垃圾收集发生之前。当垃圾收集器工作时,无论当前内存是否足够,都会回收掉只被弱引用关联的对象。WeakReference类来实现弱引用。
虚引用:也称为幽灵引用或者幻影引用,它是最弱的一种引用关系。一个对象是否有虚引用,完全不会对其生存空间构成影响,也无法通过虚引用来取得一个对象实例。为一个对象设置虚引用关联的唯一目的就是能在这个对象被收集器回收时收到一个系统通知。
1.4 对象是否死亡
即使在可达性分析算法中不可达的对象,也并非是“非死不可”的,这时候它们暂时处于“缓刑”阶段,要真正宣告一个对象死亡,至少要经历两次标记过程:如果对象在进行可达性分析后发现没有与GC Roots相连接的引用链,那它将会被第一次标记并且进行一次筛选,筛选的条件是此对象是否有必要执行finalize()方法。当对象没有覆盖finalize()方法,或者finalize()方法已经被虚拟机调用过,虚拟机将这两种情况都视为“没有必要执行”。如果这个对象判定为有必要执行finalize()方法,那么这个对象将会放置在一个叫做F-Queue的队列中,并在稍后由一个由虚拟机自动建立的、低优先级的Finalizer线程去执行它。这里所谓的“执行”是指虚拟机会触发这个方法,但并不承诺会等待它运行结束,这样做的原因是,如果一个对象在finalize()方法中执行缓慢,或者发生了死循环,将很可能导致F-Queue中其它对象永久处于等待,甚至整个内存回收崩溃。finalize方法是对象逃脱死亡命运的最后一次机会,稍后GC将对F-Queue中的对象进行第二次小规模的标记,如果对象要在finalize()中成功拯救自己——只要重新与引用链上的任何一个对象建立关联即可,譬如把自己赋值给某个类变量或者对象的成员变量,那么在第二次标记时它将被移除出“即将回收”的集合;如果对象这时候还没有逃出,那基本上就真的要被回收了。
/**
* 对象可以在被GC时自我拯救
* 自救的机会只有一个,因为一个对象的finalize()方法最多只会被系统自动调用一次
*/
public class FinalizeEscapeGC {
public static FinalizeEscapeGC SAVE_HOOK = null;
public void isAlive(){
System.out.println("yes, i am still alive");
}
@Override
protected void finalize() throws Throwable{
super.finalize();
System.out.println("finalize method executed");
FinalizeEscapeGC.SAVE_HOOK = this;
}
public static void main(String[] args) throws Throwable {
SAVE_HOOK = new FinalizeEscapeGC();
//对象第一次成功拯救自己
SAVE_HOOK = null;
System.gc();
Thread.sleep(500);
if(SAVE_HOOK!=null){
SAVE_HOOK.isAlive();
}else{
System.out.println("no, i am dead");
}
//第二次拯救与第一次一样,但是失败
SAVE_HOOK = null;
System.gc();
Thread.sleep(500);
if(SAVE_HOOK!=null){
SAVE_HOOK.isAlive();
}else{
System.out.println("no, i am dead");
}
}
}
运行结果为:
可以看到,SAVE_HOOK对象的finalize()方法确实被GC收集器触发过,并且在被收集前成功逃脱了。另外,第二次失败的原因是任何一个对象的finalize()方法都只会被系统自动调用一次,如果对象面临下一次回收,它的finalize()方法不会被再次执行,因此第二段代码的自救行动失败了。
1.5 回收方法区
判定一个常量是否是“废弃常量”比较简单,而要判定一个类是否是“无用的类”的条件则苛刻的多,需要满足以下3个条件:
1.该类的所有的实例都已经被回收,也就是Java堆中不存在该类的任何实例。
2.加载该类的ClassLoader已经被回收。
3.该类对应的java.lang.Class对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法。
2.垃圾收集算法
标记——清除算法:首先标记出所有要回收的对象,在标记完成后统一回收所有被标记的对象。缺点:效率不高,清除后空间中产生大量不连续的内存碎片。
复制算法:内存划分为两块,每次只使用其中一块,当这一块内存用完了,就将还存活的对象复制到另一块上,然后把已使用过的内存空间一次清理掉。这样使得每次都是对整个半区进行内存回收,也没有内存碎片等情况。现在的商业虚拟机都是采用这种方法来回收新生代,一般Eden和Survivor的大小比例是8比1,将内存分为一个Eden和两个小Survivor空间,每次使用Eden和其中一个Survivor,当回收时,将Eden和Survivor中还存活的对象一次性地复制到另外一块Survivor空间上,最后清理掉Eden和刚才用过的Survivor空间。
标记——整理算法:根据老年代的特点,与标记清除的算法一样,但后续步骤是让所有对象都向一端移动,然后直接清理掉端边界以外的内存。
分代收集算法:一般把Java堆分为新生代和老年代,这样就可以根据各个年代的特点采用最适当的收集算法。新生代中每次垃圾收集都发现有大量对象死去,只有少量存活,适合复制算法,而老年代中存活率高,没有额外空间进行担保,就必须使用其余两种算法。
3.HotSpot的算法实现
3.1 枚举根节点
3.2 安全点
3.3 安全区域
4.垃圾收集器
4.1 Serial收集器
4.2 ParNew收集器
4.3 Parallel Scavenge收集器
4.4 Serial Old 收集器
4.5 Parallel Old 收集器
4.6 CMS收集器
4.7 G1收集器
5. 内存分配与回收策略
5.1 对象直接在Eden分配
/**
* -verbose:gc -Xms20M -Xmx20M -Xmn10M -XX:+PrintGCDetails -XX:SurvivorRatio=8
*/
public class MinorGC {
private static final int _1MB = 1024*1024;
public static void testAllocation(){
byte[] allocation1, allocation2, allocation3, allocation4;
allocation1 = new byte[2*_1MB];
allocation2 = new byte[2*_1MB];
allocation3 = new byte[2*_1MB];
allocation4 = new byte[4*_1MB];
}
public static void main(String[] args) {
testAllocation();
}
}
运行结果
5.2 大对象直接进入老年代
/**
* -verbose:gc -Xms20M -Xmx20M -Xmn10M -XX:+PrintGCDetails -XX:SurvivorRatio=8
* -XX:PretenureSizeThreshold=3145728
*/
public class PretenureSize {
private static final int _1MB = 1024*1024;
public static void testPretenureSizeThreshold(){
byte[] allocation;
allocation = new byte[4*_1MB];
}
public static void main(String[] args) {
testPretenureSizeThreshold();
}
}
运行结果:
5.3 长期存活的对象将进入老年代
/**
* -verbose:gc -Xms20M -Xmx20M -Xmn10M -XX:+PrintGCDetails -XX:SurvivorRatio=8
* -XX:MaxTenuringThreshold=1 -XX:+PrintTenuringDistribution
*/
public class TenuringThreshold {
private static final int _1MB = 1024*1024;
public static void testTenuringThreshold(){
byte[] allocation1, allocation2, allocation3;
allocation1 = new byte[_1MB/4];
allocation2 = new byte[4*_1MB];
allocation3 = new byte[4*_1MB];
allocation3 = null;
allocation3 = new byte[4*_1MB];
}
public static void main(String[] args) {
testTenuringThreshold();
}
}
运行结果:
5.4 动态对象年龄判定
/**
* -verbose:gc -Xms20M -Xmx20M -Xmn10M -XX:+PrintGCDetails -XX:SurvivorRatio=8
* -XX:MaxTenuringThreshold=15 -XX:+PrintTenuringDistribution
*/
public class TenuringThreshold2 {
private static final int _1MB = 1024*1024;
public static void testTenuringThreshold2(){
byte[] allocation1, allocation2, allocation3, allocation4;
allocation1 = new byte[_1MB/4];
//allocation1+allocation2大于survivor空间一半
allocation2 = new byte[_1MB/4];
allocation3 = new byte[4*_1MB];
allocation4 = new byte[4*_1MB];
allocation4 = null;
allocation4 = new byte[4*_1MB];
}
public static void main(String[] args) {
testTenuringThreshold2();
}
}
运行结果:
5.5 空间分配担保
/**
* -verbose:gc -Xms20M -Xmx20M -Xmn10M -XX:+PrintGCDetails -XX:SurvivorRatio=8
* -XX:-HandlePromotionFailure
*/
public class HandlePromotion {
private static final int _1MB = 1024*1024;
public static void testHandlePromotionFailure(){
byte[] allocation1, allocation2, allocation3, allocation4, allocation5, allocation6, allocation7;
allocation1 = new byte[2*_1MB];
allocation2 = new byte[2*_1MB];
allocation3 = new byte[2*_1MB];
allocation1 = null;
allocation4 = new byte[2*_1MB];
allocation5 = new byte[2*_1MB];
allocation6 = new byte[2*_1MB];
allocation4 = null;
allocation5 = null;
allocation6 = null;
allocation7 = new byte[2*_1MB];
}
public static void main(String[] args) {
testHandlePromotionFailure();
}
}
运行结果: