JVM系列之垃圾回收(三)

常见垃圾回收算法

引用计数

java中,引用和对象是有关联的,如果要操作对象则必须引用。

通过引用计数来判断一个对象是否可以回收,给对象中添加一个引用计数器,每当有一个地方引用它,计数器+1,有一个地方引用失效,计数器-1,任何时刻计数器值为0的对象就是不可能再被利用的,那么这个对象就是可回收对象。

主流java虚拟机没有使用该算法原因:很难解决对象间相互循环引用的问题;且每次对象赋值时均要维护引用计数器,且计数器本身也有一定的消耗。

复制

堆从GC角度细分为年轻代和老年代,发生在年轻代,同时也是minorGC过程:

1.Eden,from survivor复制到to survivor,年龄+1

首先,当Eden区满时,会触发第一次GC,把活着的对象拷贝到from survivor区,当Eden再次触发GC时,会扫描Eden,from survivor区,对这两个区都进行垃圾回收,还存活的对象放到to survivor区,如果对象的年龄已经到达老年标准了,则赋值到老年代区,同时把这些对象的年龄+1

2.清空Eden,from survivor

3.互换from survivor和to survivor

最后,to和from互换,原来的to成为下一次GC时的from区。

部分对象会在from和to区域中来回复制,次数达到15次后(由JVM参数MaxTenuringThreshold决定,默认15)最终还存活的对象就进入元空间。

标记清除

分为标记和清除两个阶段,先标记出要回收的对象,然后统一回收这些对象。

标记整理

mark-compact,分为标记和压缩两部分:

标记:和标记清除中的标记一样;

压缩:再次扫描,并往一端滑动存活对象,没有空间碎片,需要利用bump,移动需要成本。

垃圾回收算法和垃圾收集器关系

GC算法(垃圾回收算法)是内存回收的方法论,GC算法有上面四种

垃圾回收器是算法的落地实现,目前没有完美的垃圾收集器,更没有万能的垃圾收集器,需要针对具体的应用来找最合适的收集器,进行分代收集。

垃圾收集器

serial垃圾收集器

parnew垃圾收集器

parallel垃圾收集器

cms垃圾收集器

g1垃圾收集器

zgc垃圾收集器

spslion垃圾收集器

shenandoah 垃圾收集器

新生代老年代垃圾收集器选择

新生代垃圾收集器

串行Serial

串行垃圾回收器(serial):为单线程环境设计,不适合服务器环境

串行收集器是最古老,最稳定以及效率最高的收集器,只使用一个线程去回收,在进行垃圾收集过程中可能会产生较长的停顿(stoptheworld),必须暂停其他所有的工作线程,直到收集完成。

它简单高效,在单CPU环境下,没有线程交互的开销,可以获得最高的单线程垃圾收集效率,因此serial垃圾收集器依旧是java虚拟机运行在client模式下默认的新生代垃圾收集器。

对应参数-XX:+UseSerialGC

开启后会使用(young区)Serial + (old区)Serial old的收集组合。年轻代老年代都会使用串行收集器,年轻代使用复制算法,老年代使用标记整理算法

并行ParNew

ParNew垃圾收集器可以说是Serial收集器年轻代的并行多线程版本,使用多线程进行垃圾回收,在垃圾收集过程中,同样会暂停其他所有的工作线程直到它收集完成。它是许多java虚拟机运行在server模式下新生代的默认垃圾收集器。

最常见的应用场景是配合老年代的CMS GC工作,其余的行为和Serial收集器完全一样。

对应JVM参数:-XX:+UseParNewGC,启用ParNew收集器,只影响新生代,不影响老年代。

开启上述参数后,会使用(young区)ParNew+(old区)SerialOld的收集器组合,新生代使用复制算法,老年代使用标记整理算法。

但是ParNew(young区)+SerialOld的收集器组合在java8已经不再被推荐

-XX:ParallelGCThreads限制线程数量,默认开启和CPU数目相同的线程数

并行Parallel Scavenge

多个垃圾收集线程并行工作,此时用户线程也是暂停的,适用于科学计算,大数据处理首台处理等若交互场景

停顿的时间会被serial短,性能更好

Parallel Scavenge收集器类似ParNew,采用复制算法,也是一个并行的多线程的垃圾收集器,俗称吞吐量优先收集器,可以说是串行收集器在新生代和老年代的并行化。

重点关注:可控制的吞吐量(吞吐量=运行用户代码时间 / (运行用户代码时间+垃圾收集时间));

例如:程序运行100分钟,垃圾收集时间1分钟,吞吐量就是99%。高吞吐量意味着高效利用CPU时间,多用于后台运算,无需太多交互的任务。

自适应调节策略Parallel Scavenge具备的功能,也是Parallel Scavenge收集器与ParNew收集器的一个重要区别

自适应调节策略:虚拟机会根据当前系统的运行情况收集性能监控信息,动态调整这些参数以提供最适合的停顿时间(-XX:MaxGCPauseMillis)或最大的吞吐量。

对应JVM参数:-XX:+ParallelGC或者-XX:+ParallelOldGC,两个配置相互激活。

开启上述参数后,会使用(young区)ParallelGC+(old区)ParallelOldGC的收集器组合。

-XX:ParallelGCThreads=数字N,表示启动几个GC线程。

CPU>8 N=5/8;

CPU<8 N=实际个数

老年代垃圾收集器

串行Serial Old

Serial Old是Serial垃圾收集器的老年代,同样是一个单线程收集器,使用标记整理算法,主要运用在client默认的java虚拟机默认的老年代垃圾收集器。

在server模式下,主要有两个用途:

  • JDK1.5以前与新生代的Parallel Scavenge收集器搭配使用。(Parallel Scavenge+Serial Old)
  • 作为老年代版中使用CMS收集器的后备垃圾收集方案。
并行Parallel Old

Parallel Old收集器是Parallel Scavenge的老年代版本,使用多线程,标记整理算法,从JDK1.6开始提供。

新生代Parallel Scavenge+老年代Serial Old的组合,只能保证新生代的吞吐量优先,无法保证整体的吞吐量,而Parallel Old在老年代同样提供吞吐量优先,如果系统对吞吐量要求较高,JDK1.8(含)后可以优先考虑Parallel scavenge(young区)+Parallel Old(old区)的搭配方式。

参数配置:-XX:+UseParallelOldGC

设置该参数后,(young区)Parallel+(old区)ParallelOld

CMS

concurrent mark sweep并发标记清除,并发收集,停顿短,以其他线程和GC线程并发执行

是一种以获取最短回收停顿时间为目标的收集器,适合于应用在互联网站或B/S系统的服务器上,尤其重视服务器的响应速度,希望系统停顿时间最短。

CMS非常适合堆内存大,CPU核数多的服务器端应用,也是G1出现之前大型应用的首选收集器。

并发标记清除收集器组合:ParNew(young区)+CMS(Old区)+Serial Old(作为CMS清除碎片的后备收集器)

开启该收集器参数:-XX:+UseConcMarkSweepGC,该参数开启后,会自动将-XX:+UseParNewGC打开。

CMS标记清除过程

1.初始标记(CMS initial mark)

只是标识一下GCROOT能直接关联哪些对象,速度很快,但是需要暂停所有的工作线程

2.并发标记(CMS concurrent mark)

进行GCROOT的跟踪过程,和用户线程一起工作,不需要暂停工作线程,主要是标记过程,标记全部对象

3.重新标记(CMS remark)

修正在并发标记初期,因用户程序继续运行而导致标记发生了变动的那一部分对象的标记记录,需要暂停所有的工作线程;主要是因为并发标记的时候工作线程也在运行,所以需要remark,进行修正

4.并发清除(CMS concurrent sweep)

清除GCROOT的不可达对象,和用户线程一起工作,不需要暂停工作线程,基于第三步的标记结果,直接清除标记对象

总结:由于耗时较长的并发标记和并发清除都是和工作线程并发执行,所以总体看来CMS收集器的内存回收和用户线程是并发执行的

CMS优点:并发收集停顿短

CMS缺点:并发执行,对CPU资源压力大;采用的标记清除算法会导致大量内存碎片

由于并发进行,CMS收集和应用线程会同时占用堆内存,CMS必须要在老年代堆内存用尽前完成垃圾回收,否则CMS回收失败时,将触发担保机制串行老年代收集器将会以STW的方式进行一次GC,从而造成较大停顿时间。

标记清除算法无法整理空间碎片,老年代空间会随着应用时长被逐步耗尽,最后将不得不通过担保机制来对堆内存进行压缩,CMS也提供了参数-XX:CMSFULLGCsBeForeCompaction(默认0,即每次都进行内存整理)来指定多少次CMS收集之后,进行一次压缩的Full GC。

G1垃圾回收器

CMS虽然减少了应用程序的停顿时间,但是存在内存碎片问题,为了去除内存碎片问题,同时保留CMS低暂停时间的优点,jdk1.7发布了新的垃圾收集器G1垃圾收集器。

Garbage-First收集器,是一款面向服务端应用的收集器。将内存分割成不同的区域然后并发的对其进行垃圾回收,像CMS收集器一样,和其他应用线程并发执行;

jdk9将G1变成默认的垃圾收集器,取代CMS,主要应用在多CPU核大内存服务器环境下,极大的减少垃圾收集的停顿时间,全面提升服务器的性能,整理空间更快;需要更多的时间来预测GC停顿时间;不需要更大的java heap。

G1的设计目标是取代CMS,和CMS相比优点在于:

  • G1是一个有整理内存过程的垃圾收集器,不会产生很多内存碎片。
  • G1的stop the world更可控,G1在停顿时间上添加了预测机制用户可以指定期望的停顿时间。可以精确控制停顿,每次根据允许停顿时间去收集垃圾最多的区域。

G1垃圾回收器使堆空间变成了两层,garbage-first heap和metaspace

G1之前收集器特点

年轻代和老年代是各自独立且连续的内存块;

年轻代收集使用单Eden+s0+s1进行复制算法;

老年代必须扫描整个老年代区域;

都是以尽可能少而快速地执行GC为设计原则。

G1垃圾回收器特点

G1能充分利用多CPU,多核环境硬件优势,尽量缩短STW。

G1整体上采用标记-整理算法,局部通过复制算法,不会产生内存碎片。

宏观上看G1之中不再区分年轻代和老年代,把内存划分为多个独立的子区域(Region),近似理解为一个棋盘。

G1也是分代收集器,但是将整个的内存区都混合在一起了,整个内存分区不存在物理上的年轻代与老年代,也不需要完全独立的survivor堆做复制准备,G1只有逻辑上的分代概念,或者说每个分区都可能随G1的运行在不同代之间来回切换,在小范围内要进行年轻代和老年代区分,保留了新生代和老年代概念,依然会采用不同的GC方式来处理不同的区域。

Region区域化垃圾收集

最大的好处是化整为零,避免全内存扫描,只需要按照区域来进行扫描即可。

区域化内存划片Region,整体编为一些列不连续的内存区域,避免了全内存区的GC操作,核心思路是将整个堆内存区域分为大小相同的子区域,在jvm启动时会自动设置这些子区域的大小,在堆的使用上,G1并不要求对象的存储一定是物理上连续的只要逻辑上连续即可,每个分区也不会固定地为某个代服务,可以按需在年轻代和老年代之间切换。

region包含以下部分:

  1. 新生代,新生代的垃圾收集依然采用暂停所有应用线程的方式,将存活对象拷贝到老年代或者survivor空间;
  2. 老年代,G1收集器通过将对象从一个区域复制到另外一个区域,完成了清理工作,这意味着,在正常的处理过程中,G1完成了堆的压缩(至少是部分堆的压缩),这样也就不会有CMS内存碎片问题的存在了。
  3. Humongous(巨大的)区域,如果一个对象占用的空间超过了分区容量50%以上,G1收集器就认为这是一个巨型的对象,这样巨型对象默认直接分配到老年代,但是如果它是一个短期存在的巨型对象,就会对垃圾收集器造成负面影响,为了解决这个问题,G1划分了一个humongous区,用来专门存放巨型对象,如果一个H区装不下一个巨型对象,那么G1会寻找连续的H分区来存储,为了能找到连续的H区,有时候不得不启动Full GC。
G1垃圾收集器回收步骤

针对Eden区进行收集,Eden区耗尽后会被触发,主要是小区域收集+形成连续的内存块,避免内存碎片

Eden区的数据移动到survivor区,假如出现survivor区空间不够,Eden区数据会部分到old区;

survivor区的数据移动到新的survivor区,部分数据晋升到old区;

最后Eden区收拾干净,GC结束,用户的应用程序继续执行。

初始标记:只标记GC Roots能直接关联到的对象

并发标记:进行GC Roots Tracing的过程

最终标记:修正并发标记期间,因程序运行导致标记发生变化的那一部分对象

筛选回收:根据时间来进行价值最大化的回收

G1常用配置参数

-XX:+UseG1GC:使用G1收集器

-XX:G1HeapRegionSize=n:设置G1区域的大小,值是2的幂,范围是1M到32M,默认将整堆划分为2048个分区,也即能支持的最大内存为:32MB*2048 = 65536M=64G内存。

-XX:MaxGCPauseMillis=n:最大GC停顿时间,JVM将尽可能(但不保证)停顿小于这个时间,默认200ms

-XX:InitiatIngHeapOccupanyPercent=n:堆占用了多少的时候就触发GC,默认是45

-XX:ConcGCThreads=n:并发GC使用的线程数

-XX:G1ReservePercent=n:设置作为空闲空间的预留内存百分比,以降低目标空间溢出的风险,默认值是10%

-XX:ParallelGCThreads:指定GC工作的线程数量

-XX:G1NewSizePercent:新生代内存初始空间(默认整堆5%,值配置整数,默认就是百分比)

-XX:G1MaxNewSizePercent:新生代内存最大空间

-XX:TargetSurvivorRatio:Survivor区的填充容量(默认50%),Survivor区域里的一批对象(年龄1+年龄2+年龄n的多个年龄对象)总和超过了Survivor区域的50%,此时就会把年龄n(含)以上的对象都放入老年代

-XX:MaxTenuringThreshold:最大年龄阈值(默认15)

-XX:InitiatingHeapOccupancyPercent:老年代占用空间达到整堆内存阈值(默认45%),则执行新生代和老年代的混合收集(MixedGC),比如我们之前说的堆默认有2048个region,如果有接近1000个region都是老年代的region,则可能就要触发MixedGC了

-XX:G1MixedGCLiveThresholdPercent(默认85%) region中的存活对象低于这个值时才会回收该region,如果超过这个值,存活对象过多,回收的的意义不大

实际选择垃圾收集器

单CPU或小内存,单机程序:-XX:+UseSerialGC

多CPU,需要大吞吐量,如大量后台计算:+XX:+UseParallelGC/+XX:+UseParallelOldGC

多CPU,低停顿时间,如快速响应的互联网应用:-XX:+UseConcMarkSweepGC/-XX:+ParNewGC

参数

垃圾收集器

垃圾收集算法

-XX:+UseSerialGC

年轻代:SerialGC

老年代:SerialOldGC

年轻代:复制

老年代:标记整理

-XX:+UseParNewGC

年轻代:ParNew

老年代:SerialOldGC

年轻代:复制

老年代:标记整理

-XX:+UseParallelGC/

-XX:+UseParallelOldGC

年轻代:Parallel scavenge

老年代:ParallelOld

年轻代:复制

老年代:标记整理

-XX:+UseConcMarkSweepGC

年轻代:ParNew

老年代:CMS+SerialOld

年轻代:复制

老年代:标记清除

-XX:+UseG1GC

G1

局部复制

整理标记整理

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值