垃圾收集策略与算法
大家好,精神小伙,探秘猎奇,极客精神,用不放弃!
今天咱们来扒一扒Java里头的垃圾收集。垃圾分类,有你有我,全民环保,人人有责!
没错,显示社会需要回收垃圾,清除垃圾,咱们JVM也是。那么,JVM中的垃圾都有啥?都是哪个倒霉孩子给制造的呢?
垃圾都有啥
这要从咱们探秘系列的第一章说起。JVM中分为程序计数器,Java栈,C栈,堆,方法区。可以看到,程序计数器和那两个栈,当方法执行结束后,申请的内存空间自动被回收,不会产生内存垃圾。唯有堆和方法区,一个存放对象,一个存放类信息,常量,静态变量。其中,方法区还被亲切的称为“永久代”,足见其存活时间之久。这两个地方,你不主动回收垃圾,哪天垃圾多了就堵门口了,你想出都出不去了。
你是不是垃圾
不好意思,在读的各位,都是垃圾。。。刀下留人,我的意思是,垃圾回收的一个重要问题,就是如何判断一个对象是不是垃圾。JVM里认为,一个对象,如果不被任何对象或变量引用,那么它就是个垃圾!那么,如何判断它是否被其他对象或变量引用呢?方法有二:
1.引用计数法
在对象头里,放个counter计数器,产生个引用,就+1,少了个引用,就-1。最后判断如果为0,就认为没人引用了。是垃圾!
这个方法简单粗暴,但有个问题,叫对象的循环引用问题。object a=new b();object b=new a();这俩人互相抱团,彼此给了对方对象头一个1,好么,你俩永远不会是垃圾了。正是因为有这种流氓存在,主流JVM基本放弃了这种方式;
2.可达性分析法
先理解个名词,GC Roots。它包括了:Java栈引用的对象,C栈引用的对象,本地方法区中常量引用的对象,本地方法区中静态属性引用的变量。
好,这种算法,就是依次遍历GC Roots中的成员,如果都和对象没关系了,好,对象小朋友,不好意思,你就是个垃圾。
有关系没关系
可达性分析法的一个关键,就是判断引用和对象到底有没有关系。那么首先能想到的,就是两种状态:有关系和没关系。JDK1.2之前都是这么干的。但成年人的世界,可不是非黑即白的,也要有声色犬马的灰色地带,如果能做到在空间充足的时候,留着对象,紧张时候把它清除掉,那是最好的了。OK,在1.2后,JVM将引用分为了四类,和对象的关系由强到弱,被视为垃圾的可能性则由弱到强。
强引用
Object a=new Object();这样事儿的就是强引用。只要引用在,就永远不会回收。但如果你把这个引用声明成静态的,那么它就会一直存在,多了就会导致大名鼎鼎的内存泄露。
软引用
这个引用关联比强引用弱一些,当内存空间不足时,这部分引用的对象就会被拿来祭旗。如果空闲,就先留着,通常用来实现内存敏感的缓存。
弱引用
这部分最惨,不管有没有空间,直接回收,垃圾!
虚引用
这部分还有着更为神秘的名字“幽灵引用”,“幻影引用”。其实,它不会对判定对象是不是垃圾有任何影响。它只是一种机制,保证在finalize后,能完成某些事情。
堆中垃圾回收
finalize()
堆中对象回收,靠调用finalize()方法。那么在每次调用之前,如果对象没有覆盖finalize()方法,或者已经被虚拟机调用了,就认为这个对象已经被回收了,不必调用。
如果没有,那就把这个对象扔进F-Queue队列里头,虚拟机会优先级比较低的处理这个队列每个对象的finalize,但如果某个finalize特别耗时,抱歉,爷等不了,直接视为垃圾回收之。
对象重生
一个对象,如果在finalize的时候,被指向了某个引用,那么它就活过来了。但每个对象只有一次执行finalize的机会,所以重生的机会只有一次,请珍惜!
方法区垃圾回收
主要垃圾分为两种:废弃常量,无用的类
废弃常量
常量存放在常量池,如果没有引用指向这个常量,那么就会在必要的时候,将这个常量清理出常量池。
无用的类
什么样的类信息是无用的呢?必须要满足以下三个条件才行:
1.类对象全部被干掉;
2.ClassLoader被回收;
3.java.lang.Class没有被任何地方引用,无法在任何地方通过访问该类。
垃圾收集算法
好,如何判定垃圾掌握了,下面就开始回收垃圾吧。
标记-清除算法
分两步:1.标记:先遍历第一轮GC Roots中的对象,所有活着的做上记号;
2.清除:遍历第二轮GC Roots中的对象,把死了的干掉,同时,把活着的标记去掉,方便下一轮标记。
这个方法,可以看出,有两个特点:
1.需要遍历,还TM得遍历两次,效率太低;
2.会产生碎片,如果分配对象过大,没法找到连续内存给新的对象,就需要再次触发算法,进行下一轮的标记清除。
复制算法(新生代)
这个主要是为了解决标记-清除算法的效率问题。把整个内存分为大小相等的两块,每次只使用其中的一块,然后另一块留着。当进行一次遍历标记后,将活着的对象全部复制到另一块上头。完了直接清除这块上面的所有对象。简单高效。
但效率高了,内存却浪费了,因为每次只能使用一半的内存。
为了解决这个问题,前辈们想出这么个招,分三个区域:Eden,from survivor,to survivor,比例为8:1:1,好,每次用Eden和任意一块survior,然后遍历标记,将活着的放到另一块survivor上头,之后将使用的Eden和survivor清掉。这样,每次都只有一块survivor没有被用来分配内存,内存浪费率为10%,漂亮!
但这个也有个问题,每次无法保证我们new的对象,只有十分之一这么些,如果大了咋整?这就要用到分配担保。
首先,当Eden+survivor中内存不够时,出发MinorGC进行回收;
其次,如果回收后,有超过10%对象存活,这些活着的对象通过分配担保机制进入老年代,新对象继续生成在Eden中。
标记-整理算法(老年代)
标记:这个和标记清除一样,遍历GC Roots;
整理:把所有活着的,甭管在哪儿,一块按内存地址依次排序。之后把末端地址以后的全部内存进行回收。
老年代针对的都是一些寿命长的老人,如果用上面的复制算法,每次都得把这些百岁老人复制一遍,效率太低。
分代收集算法
针对不同代的人儿,采用不同的垃圾处理方式
新生代:复制算法
老年代:标记-清除 标记-整理。
讲了一整篇的垃圾,其实就是分为:先判定你是不是垃圾?如果是垃圾,怎么回收你?好吧,不知道大家垃圾明白了么。。。
作诗一首:
垃圾分类最环保,利国利民真挺好;判断垃圾是关键,回收算法分代找!
下集HotSpot垃圾收集器见!