Java虚拟机垃圾收集器分析
1 、活动对象
l 追踪 root 对象算法: 深度追踪 root 对象,将 heap 中所有被引用到的 root 做标志,所有未被标志的对象视为非活动对象,所占用的空间视为非活动内存。
2 、常用算法
l Copy 算法
1 方法:将内存分为两个区域( from space 和 to space )。所有的对象分配内存都分配到 from space 。在清理非活动对象阶段,把所有标志为活动的对象, copy 到 to space ,之后清楚 from space 空间。然后互换 from sapce 和 to space 的身份。既原先的 from space 变成 to sapce ,原先的 to space 变成 from space 。每次清理,重复上述过程。
2 优点: copy 算法不理会非活动对象, copy 数量仅仅取决为活动对象的数量。并且在 copy 的同时,整理了 heap 空间,即, to space 的空间使用始终是连续的,内存使用效率得到提高。
3 缺点:划分 from space 和 to space ,内存的使用率是 1 / 2 。一般在 Young Generation 中使用。
l Compaction 算法
1 方法:在清理非活动对象阶段,删除非活动对象占用内存,并且把活动对象向 heap 的底部移动,直到所有的活动对象被移到 heap 的一侧。
2 优点:无须划分 from sapce 和 to space ,提高内存的使用率。并且 compaction 后的内存空间也是连续分配的。
3 缺点:该算法相对比较复杂。一般在 Tenured Generation 中使用
1、 内存划分
l Young Generation
1 生命周期很短的对象,归为 young generation 。由于生命周期很短,这部分对象在 gc 的时候,很大部分的对象已经成为非活动对象。因此针对 young generation 的对象,采用 copy 算法,只需要将少量的存活下来的对象 copy 到 to space 。存活的对象数量越少,那么copy 算法的效率越高。
2 young generation 的 gc 称为 minor gc 。经过数次 minor gc ,依旧存活的对象,将被移出 young generation ,移到 tenured generation
3 young generation 分为:
1 eden :每当对象创建的时候,总是被分配在这个区域
2 survivor1 : copy 算法中的 from space
3 survivor2 : copy 算法中的 to sapce (备注:其中 survivor1 和 survivor2 的身份在每次 minor gc 后被互换)
4 minor gc 的时候,会把 eden+survivor1(2) 的对象 copy 到 survivor2(1) 去。
l Tenured Generation
1 生命周期较长的对象,归入到 tenured generation 。一般是经过多次 minor gc ,还 依旧存活的对象,将移入到 tenured generation 。(当然,在 minor gc 中如果存活的对象的超过 survivor 的容量,放不下的对象会直接移入到 tenured generation )
2 tenured generation 的 gc 称为 major gc ,就是通常说的 full gc 。
3 采用 compactiion 算法。由于 tenured generaion 区域比较大,而且通常对象生命周期都比较常, compaction 需要一定时间。所以这部分的 gc 时间比较长。
4 minor gc 可能引发 full gc 。当 eden + from space 的空间大于 tenured generation 区的剩余空间时,会引发 full gc 。这是悲观算法,要确保 eden + from space 的对象如果都存活,必须有足够的 tenured generation 空间存放这些对象。
l Permanet Generation
1 该区域比较稳定,主要用于存放 classloader 信息,比如类信息和 method 信息。
2 对于 spring hibernate 这些需要动态类型支持的框架,这个区域需要足够的空间。
算法补充:
基本回收算法
- 引用计数(Reference Counting)
比较古老的回收算法。原理是此对象有一个引用,即增加一个计数,删除一个引用则减少一个计数。垃圾回收时,只用收集计数为0的对象。此算法最致命的是无法处理循环引用的问题。 - 标记-清除(Mark-Sweep)
此算法执行分两阶段。第一阶段从引用根节点开始标记所有被引用的对象,第二阶段遍历整个堆,把未标记的对象清除。此算法需要暂停整个应用,同时,会产生内存碎片。 - 复制(Copying)
此算法把内存空间划为两个相等的区域,每次只使用其中一个区域。垃圾回收时,遍历当前使用区域,把正在使用中的对象复制到另外 一个区域中。次算法每次只处理正在使用中的对象,因此复制成本比较小,同时复制过去以后还能进行相应的内存整理,不过出现“碎片”问题。当然,此算法的缺 点也是很明显的,就是需要两倍内存空间。 - 标记-整理(Mark-Compact)
此算法结合了“标记-清除”和“复制”两个算法的优点。也是分两阶段,第一阶段从根节点开始标记所有被引用对象,第二阶段遍历 整个堆,把清除未标记对象并且把存活对象“压缩”到堆的其中一块,按顺序排放。此算法避免了“标记-清除”的碎片问题,同时也避免了“复制”算法的空间问 题。 - 增量收集(Incremental Collecting)
实施垃圾回收算法,即:在应用进行的同时进行垃圾回收。不知道什么原因JDK5.0中的收集器没有使用这种算法的。 - 分代(Generational Collecting)
基于对对象生命周期分析后得出的垃圾回收算法。把对象分为年青代、年老代、持久代,对不同生命周期的对象使用不同的算法(上述方式中的一个)进行回收。现在的垃圾回收器(从J2SE1.2开始)都是使用此算法的。
二、垃圾回收器
目前的收集器主要有三种:串行收集器、并行收集器、并发收集器 。
- 串行收集器
使用单线程处理所有垃圾回收工作,因为无需多线程交互,所以效率比较高。但是,也无法使用多处理器的优势,所以此收集器适合单处理器机器。当然,此收集器也可以用在小数据量(100M 左右)情况下的多处理器机器上。可以使用-XX:+UseSerialGC 打开。 - 并行收集器
- 对年轻代进行并行垃圾回收,因此可以减少垃圾回收时间。一般在多线程多处理器机器上使用。使用-XX:+UseParallelGC .打开。并行收集器在J2SE5.0第六6更新上引入,在Java SE6.0中进行了增强--可以堆年老代进行并行收集。如果年老代不使用并发收集的话,是使用单线程进行垃圾回收 ,因此会制约扩展能力。使用-XX:+UseParallelOldGC 打开。
- 使用-XX:ParallelGCThreads=<N> 设置并行垃圾回收的线程数。此值可以设置与机器处理器数量相等 。
- 此收集器可以进行如下配置:
- 最大垃圾回收暂停: 指定垃圾回收时的最长暂停时间,通过-XX:MaxGCPauseMillis=<N> 指定。<N>为毫秒.如果指定了此值的话,堆大小和垃圾回收相关参数会进行调整以达到指定值 。设定此值可能会减少应用的吞吐量。
- 吞吐量: 吞吐量为垃圾回收时间与非垃圾回收时间的比值 ,通过-XX:GCTimeRatio=<N> 来设定,公式为1/(1+N) 。例如,-XX:GCTimeRatio=19时,表示5%的时间用于垃圾回收。默认情况为99,即1%的时间用于垃圾回收。
- 并发收集器
可以保证大部分工作都并发进行(应用不停止),垃圾回收只暂停很少的时间,此收集器适合对响应时间要求比较高的中、大规模应用。使用-XX:+UseConcMarkSweepGC 打开。
- 并发收集器主要减少年老代的暂停时间,他在应用不停止的情况下使用独立的垃圾回收线程,跟踪可达对象。在每个年老代垃圾回收周期 中,在收集初期并发收集器会对整个应用进行简短的暂停,在收集中还会再暂停一次。第二次暂停会比第一次稍长,在此过程中多个线程同时进行垃圾回收工作。
- 并发收集器使用处理器换来短暂的停顿时间 。在一个N个处理器的系统上,并发收集部分使用K/N 个可用处理器进行回收,一般情况下1<=K<=N/4 。
- 在只有一个处理器的主机上使用并发收集器 ,设置为incremental mode 模式也可获得较短的停顿时间。
- 浮动垃圾 :由于在应用运行的同时进行垃圾回收,所以有些垃圾可能在垃圾回收进行完成时产生,这样就造成了“Floating Garbage”,这些垃圾需要在下次垃圾回收周期时才能回收掉。所以,并发收集器一般需要20% 的预留空间用于这些浮动垃圾。
- Concurrent Mode Failure :并发收集器在应用运行时进行收集,所以需要保证堆在垃圾回收的这段时间有足够的空间供程序使用,否则,垃圾回收还未完成,堆空间先满了。这种情况下将会发生“并发模式失败”,此时整个应用将会暂停,进行垃圾回收。
- 启动并发收集器 :因为并发收集在应用运行时进行收集,所以必须保证收集完成之前有足够的内存空间供程序使用,否则会出现“Concurrent Mode Failure”。通过设置-XX:CMSInitiatingOccupancyFraction=<N> 指定还有多少剩余堆时开始执行并发收集
- 小结
- 串行处理器:
--适用情况:数据量比较小(100M左右);单处理器下并且对响应时间无要求的应用。
--缺点:只能用于小型应用 - 并行处理器:
--适用情况:“对吞吐量有高要求”,多CPU、对应用响应时间无要求的中、大型应用。举例:后台处理、科学计算。
--缺点:应用响应时间可能较长 - 并发处理器:
--适用情况:“对响应时间有高要求”,多CPU、对应用响应时间有较高要求的中、大型应用。举例:Web服务器/应用服务器、电信交换、集成开发环境。
- 串行处理器: