GC回收机制及算法

1.概述

说起垃圾收集(Garbage Collection, GC),大部分人都把这项技术当做Java语言的伴生产物。事实上,GC的历史比Java久远,1960年诞生于MIT的Lisp是第一门真正使用内存动态分配和垃圾收集技术的语言。当Lisp还在胚胎时期时,人们就在思考GC需要完成的3件事情:
1)哪些内存数据需要回收?
2)什么时候回收?
3)如何回收?

2.哪些内存数据需要被回收

2.1.引用计数算法

当对象创建时,会生成一个引用计数器。如果其他对象引用这个对象,引用一次计数器+1。失去引用,计数器-1。
当一个对象的引用计数器为0时,则可以判定它是一个垃圾对象。
优点:原理简单,实现方便
缺点:不能解决对象之间的循环引用问题,容易引起内存泄露

例如: String a = “hello”;
String b = “word”;
a = b;
b = a;
上例中,由于对象之间循环引用,导致计数器永不为0,回收不掉,导致内存泄露。

2.2.可达性分析算法

在主流的商用程序语言(Java、C#,甚至包括前面提到的古老的Lisp)的主流实现中,
都是通过可达性分析(Reachability Analysis)来判定对象是否存活的。
这个算法的基本思路就是通过一系列的称为“GC Roots”的对象作为起始点,从这些节点开始向下搜索,
搜索所走过的路径称为引用链(Reference Chain),当一个对象到GC Roots没有任何引用链相连
(用图论的话来说,就是从GC Roots到这个对象不可达)时,则证明此对象是不可用的。

在这里插入图片描述

在Java语言中,可作为GC Roots的对象包括下面几种:
1)虚拟机栈(栈帧中的本地变量表)中引用的对象。
2)方法区中类静态属性引用的对象。
3)方法区中常量引用的对象。

2.3.栈、堆、方法区存储的内容

堆区:
1.存储的全部是对象,每个对象都包含一个与之对应的class的信息。(class的目的是得到操作指令)
2.jvm只有一个堆区(heap)被所有线程共享,堆中不存放基本类型和对象引用,只存放对象本身 。
栈区:
1.每个线程包含一个栈区,栈中只保存基础数据类型的值和对象的引用
2.每个栈中的数据(基础数据类型和对象引用)都是私有的,其他栈不能访问。
3.栈分为3个部分:基本类型变量区、执行环境上下文、操作指令区(存放操作指令)。
方法区:
1.又叫静态区,跟堆一样,被所有的线程共享。方法区包含所有的class和static变量。
2.方法区中包含的都是在整个程序中永远唯一的元素,如class,static变量。

3.如何回收垃圾数据

3.1.标记-清除算法(Mark-Sweep)

最基础的收集算法,分为“标记”和“清除”两个阶段:首先标记出所有活动对象(可达对象),
在标记完成后统一回收所有未标记的对象(即垃圾对象)。
后续的收集算法都是基于这种思路并对其不足进行改进而得到的。
优点:原理简单
缺点:
(1)效率问题,标记和清除两个过程的效率都不高;
(2)空间问题,标记清除之后会产生大量不连续的内存碎片,
空间碎片太多可能会导致以后在程序运行过程中需要分配较大对象时,
无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。

执行过程如下图所示:

在这里插入图片描述

3.2.复制算法(Copying)

它将可用内存按容量划分为大小相等的两块,每次只使用其中的一块。当这一块的内存用完了,
就将还存活  着的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。

在这里插入图片描述

优点:避免产生内存碎片
缺点:内存利用率,原始的只有50%。
现在的商业虚拟机都采用这种收集算法来回收新生代

新生代:主要是用来存放新生的对象
老年代:主要存放应用程序中生命周期长的内存对象
新生代回收机制:
1.IBM公司的专门研究表明,新生代中的对象98%是“朝生夕死”的,所以并不需要按照1:1的比例来划分内存空间
2.将内存分为一块较大的Eden空间和两块较小的Survivor空间
3.每次使用Eden和其中一块Survivor。
4.当回收时,将Eden和Survivor中还存活着的对象一次性地复制到另外一块Survivor空间上,最后清理掉Eden和刚才用过的Survivor空间。
5.虚拟机默认Eden和Survivor的大小比例是8:1,也就是每次新生代中可用内存空间为整个新生代容量的90%(80%+10%),只有10%的内存会被“浪费”。

在这里插入图片描述

老年代:
1.新生代对象存活15次(默认配置)可晋升到老生代
2.新生代的GC ->Minor GC频率较高
3.老生代的GC ->Major GC(Full GC)频率较低
4.在进行MajorGC前一般都先进行了一次MinorGC,使得有新生代的对象晋身入老年代,导致空间不够用时才触发
5.GC调优的目的是尽量避免Full GC的出现或延迟Full GC的到来。因为Full GC是全堆GC,耗时很长,会影响正常的工作线程

3.3.标记-整理算法(Mark-Compact)

与“标记-清除”算法一样,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,
然后直接清理掉端边界以外的内存,如图所示。

在这里插入图片描述

老年代很少发生GC,因为都是常用的对象,但当老年代的空间满了之后,同样会发生GC回收,称为Major GC,
也有的叫Full GC,此时底层一般用的算法就是这种标记-整理算法

3.4.分代收集算法

一般是把Java堆分为新生代和老年代,这样就可以根据各个年代的特点采用最适当的收集算法。
在新生代中,每次垃圾收集时都发现有大批对象死去,只有少量存活,那就选用复制算法,
只需要付出少量存活对象的复制成本就可以完成收集。而老年代中因为对象存活率高、没有额外空间对它进行分配担保,
就必须使用“标记—清理”或者“标记—整理”算法来进行回收。

4.GC收集器

在这里插入图片描述

上图展示了 java目前内置的所有GC收集器。如果收集器之间有连线,表示可以配合使用。
比如:Serial (新生代)和Serial Old (老年代) 可以一起使用
比如:Serial和Parallel Old不可以一起使用

4.1.Serial和Serial Old收集器

Serial 和 Serial Old 特点:
1.单线程收集器
2.收垃圾时,必须暂停其他工作线程,产生停顿(stop the world),并且停顿时间很长 补充:上图中的所有收集器在回收垃圾时,都会产生Stop the world,只不过停顿时间有长有短

在这里插入图片描述

Serial系列收集器可以应用于桌面系统的垃圾回收,因为回收的数据非常少。

4.2.ParNew收集器

是Serial的多线程版本,所以效率更高,停顿时间更短,用来回收新生代垃圾。此外,除了Serial收集器外,目前只有它能与CMS收集器配合工作

在这里插入图片描述

4.3.CMS收集器(Concurrent Mark Sweep)

并发低停顿收集器
停顿时间最短。CMS应用于低延迟响应系统,比如B/S系统,再比如大数据框架 HBase,Redis 等
CMS的实现思路,把整个回收分成4个阶段:
(1)初始标记-> 停顿,仅是扫描GC Root引用链直接连接的引用,停顿很短
(2)并发标记-> 没有停顿,并发指的是可以和工作线程一起工作,标记所有可达的引用
(3)重新标记-> 停顿,仅是扫描GC Root引用链,停顿很短,作用是修正并发标记阶段引起的引用链变更。
(4)并发清除-> 没有停顿,即回收垃圾的时候,允许和工作前程一起工作,即 CMS将停顿最长的垃圾回收阶段设计为并发机制,所以极大了降低了停顿时间

在这里插入图片描述

优点:停顿时间最短,快速响应,用户体验良好
缺点:
(1)可能会产生一些浮动垃圾,这些浮动垃圾只能等到下一次GC到来时才能收掉
(2)由于并发清除机制,垃圾收集线程和正常的工作共同抢占cpu时间片, 可能会降低工作线程的执行效率
(3)CMS回收垃圾用的是标记—清除算法,所以会产生内存碎片。所以需要定期进行碎片整理

4.4.Parallel 和Parallel Old收集器

是吞吐量优先收集器,不关注垃圾回收的停顿时间,而是关注垃圾回收的吞吐量。典型案例:Hadoop, Spark离线, MongoDB等。

4.5.G1GC (Garbage-First GC)

jdk1.7试运行,jdk1.8以后开始默认G1
回收机制:
1.它将整个堆分为若干个预先设定的小区域块
2.每个区域块内部不再进行新旧分区, 而是将整个区域块标记为Eden/Survivor/Old
3.当创建新对象时,它首先被存放到某一个可用区块中(Eden)
4.当该区块满了,JVM就会创建新的区块存放对象。
5.当发生minor GC时,JVM将一个或几个区块中存活的对象拷贝到一个新的区块中(Survivor)
6.所有区存满,找不到全空区块时,才发生Full GC
7.G1使用RememberSet的概念,将每个分区外指向分区内的引用记录在该分区的RememberSet中,避免了对整个Heap的扫描,使得各个分区的GC更加独立。

在这里插入图片描述

优点:
①内存利用率非常高,而传统的设计可能会出现新生代资源紧张而老生代比较空间的情况,即造成内存资源浪费。集群的内存资源越大,G1的优势越明显
②G1 GC触发Full GC的条件是:找不到全空区域块时,才会发生 Full GC。所以G1 GC的Full GC出现频率更低,这是我们所希望见到的。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值