3. GC 算法(基础篇) - GC参考手册

本文介绍了垃圾回收(GC)的基本原理和技术,主要包括标记可达对象和删除不可达对象两个步骤,并概述了几种不同的GC算法,如标记-清除、标记-整理和标记-复制等。

相关术语翻译说明:

Mark,标记;

Sweep,清除;

Compact,整理; 也有人翻译为压缩,译者认为GC时不存在压缩这回事。

Copy,复制; copy 用作名词时一般翻译为拷贝/副本,用作动词时翻译为复制。

注: 《垃圾回收算法手册》将 Mark and Sweep 翻译为: 标记-清扫算法; 译者认为 标记-清除 更容易理解。

您应该已经阅读了前面的章节:

  1. 垃圾收集简介 - GC参考手册
  2. Java中的垃圾收集 - GC参考手册

本章简要介绍GC的基本原理和相关技术, 下一章节再详细讲解GC算法的具体实现。各种垃圾收集器的实现细节虽然并不相同,但总体而言,垃圾收集器都专注于两件事情:

  • 查找所有存活对象
  • 抛弃其他的部分,即死对象,不再使用的对象。

第一步, 记录(census)所有的存活对象, 在垃圾收集中有一个叫做 标记(Marking) 的过程专门干这件事。

标记可达对象(Marking Reachable Objects)

现代JVM中所有的GC算法,第一步都是找出所有存活的对象。下面的示意图对此做了最好的诠释:

03_01_Java-GC-mark-and-sweep.png

首先,有一些特定的对象被指定为 Garbage Collection Roots(GC根元素)。包括:

  • 当前正在执行的方法里的局部变量和输入参数
  • 活动线程(Active threads)
  • 内存中所有类的静态字段(static field)
  • JNI引用

其次, GC遍历(traverses)内存中整体的对象关系图(object graph),从GC根元素开始扫描, 到直接引用,以及其他对象(通过对象的属性域)。所有GC访问到的对象都被标记(marked)为存活对象。

存活对象在上图中用蓝色表示。标记阶段完成后, 所有存活对象都被标记了。而其他对象(上图中灰色的数据结构)就是从GC根元素不可达的, 也就是说程序不能再使用这些不可达的对象(unreachable object)。这样的对象被认为是垃圾, GC会在接下来的阶段中清除他们。

在标记阶段有几个需要注意的点:

在标记阶段,需要暂停所有应用线程, 以遍历所有对象的引用关系。因为不暂停就没法跟踪一直在变化的引用关系图。这种情景叫做 Stop The World pause (全线停顿),而可以安全地暂停线程的点叫做安全点(safe point), 然后, JVM就可以专心执行清理工作。安全点可能有多种因素触发, 当前, GC是触发安全点最常见的原因。

此阶段暂停的时间, 与堆内存大小,对象的总数没有直接关系, 而是由存活对象(alive objects)的数量来决定。所以增加堆内存的大小并不会直接影响标记阶段占用的时间。

标记 阶段完成后, GC进行下一步操作, 删除不可达对象。

删除不可达对象(Removing Unused Objects)

各种GC算法在删除不可达对象时略有不同, 但总体可分为三类: 清除(sweeping)、整理(compacting)和复制(copying)。下一章节将详细讲解这些算法。

Sweep(清除)

Mark and Sweep(标记-清除) 算法的概念非常简单: 直接忽略所有的垃圾。也就是说在标记阶段完成后, 所有不可达对象占用的内存空间, 都被认为是空闲的, 因此可以用来分配新对象。

这种算法需要使用 空闲表(free-list),来记录所有的空闲区域, 以及每个区域的大小。维护空闲表增加了对象分配时的开销。此外还存在另一个弱点 —— 明明还有很多空闲内存, 却可能没有一个区域的大小能够存放需要分配的对象, 从而导致分配失败(在Java 中就是 OutOfMemoryError)。

03_02_GC-sweep.png

Compact(整理)

标记-清除-整理算法(Mark-Sweep-Compact), 将所有被标记的对象(存活对象), 迁移到内存空间的起始处, 消除了标记-清除算法的缺点。 相应的缺点就是GC暂停时间会增加, 因为需要将所有对象复制到另一个地方, 然后修改指向这些对象的引用。此算法的优势也很明显, 碎片整理之后, 分配新对象就很简单, 只需要通过指针碰撞(pointer bumping)即可。使用这种算法, 内存空间剩余的容量一直是清楚的, 不会再导致内存碎片问题。

03_03_GC-mark-sweep-compact.png

Copy(复制)

标记-复制算法(Mark and Copy) 和 标记-整理算法(Mark and Compact) 十分相似: 两者都会移动所有存活的对象。区别在于, 标记-复制算法是将内存移动到另外一个空间: 存活区。标记-复制方法的优点在于: 标记和复制可以同时进行。缺点则是需要一个额外的内存区间, 来存放所有的存活对象。

03_04_GC-mark-and-copy-in-Java.png

请继续阅读下一章: 4. GC 算法(实现篇) - GC参考手册

原文链接: GC Algorithms: Basics

翻译人员: 铁锚 http://blog.csdn.net/renfufei

翻译时间: 2016年02月06日

基础-0-Java虚拟机导学课程 11:33 基础-1-初识JVM 22:27 基础-2-Java虚拟机的组成 04:47 基础-3-字节码文件的组成-以正确的姿势打开字节码文件 10:41 基础(补)-3.5-字节码文件的组成-基础信息 15:54 基础-4-字节码文件的组成-常量池和方法 25:51 基础-5-字节码文件常见工具的使用1 11:43 基础-6-字节码文件常见工具的使用2 22:20 基础-7-类的生命周期加载阶段 22:09 基础-8-类的生命周期2连接阶段 19:58 基础-9-类的生命周期3初始化阶段 26:27 基础-10-类加载器的分类 13:56 基础-11-启动类加载器 13:36 基础-12-扩展和应用程序类加载器 16:26 基础-13-双亲委派机制 18:43 基础-14-打破类的双亲委派机制-自定义类加载器 25:16 基础-15-打破双亲委派机制2-线程上下文类加载器 20:17 基础-16-打破双亲委派机制3-osgi和类的热部署 11:53 基础-17-JDK9之后的类加载器 09:05 基础-18-运行时数据区-程序计数器 15:42 基础-19--局部变量表 19:20 基础-20--操作数栈和帧数据 12:08 基础-21--内存溢出 15:28 基础-22-堆内存 25:56 基础-23-方法区的实现 16:25 基础-24-方法区-字符串常量池 20:40 基础-25-直接内存 12:39 基础-26-自动垃圾回收 11:32 基础-27-方法区的回收 11:32 基础-28-引用计数法 15:41 基础-29-可达性分析法 20:25 基础-30-软引用 24:40 基础-31-弱虚终结器引用 12:08 基础-32-垃圾回收算法的评价标准 13:31 基础-33-垃圾回收算法1 10:05 基础-34-垃圾回收算法-分代GC 20:19 基础-35-垃圾回收器1 15:54 基础-36-垃圾回收器2 11:44 基础-37-垃圾回收器3 15:51 基础-38-g1垃圾回收器 26:23 实战-1-内存泄漏和内存溢出 21:25 实战-2-解决内存泄漏-监控-top命令 12:16 实战-3-解决内存泄漏-监控-visualvm 12:50 实战-4-解决内存泄漏-监控-arthas tunnel 15:18 实战-5-解决内存泄漏-监控-prometheus-grafana 17:53 实战-6-解决内存泄漏-堆内存状况对比 08:39 实战-7-解决内存泄漏-内存泄漏产生的几大原因 16:01 实战-8-内存泄漏产生的原因2 13:30 实战-9-内存泄漏产生的原因3 10:43 实战-10-内存泄漏产生的原因4 10:04 实战-11-内存泄漏产生原因2-并发请求问题 17:30 实战-12-导出堆内存快照并使用MAT分析 08:38 实战-13-MAT内存泄漏检测原理 17:23 实战-14-服务器导出内存快照和MAT使用小技巧 13:31 实战-15-实战1-查询大数据量导致的内存溢出 26:24 实战-16-实战2-mybatis导致的内存溢出 10:34 实战-17-实战3-k8s容器环境导出大文件内存溢出 26:13 实战-18-系统不处理业务时也占用大量的内存 14:13 实战-19-文章审核接口的内存问题 18:28 实战-20-btrace和arthas在线定位问题 20:15 实战-21-GC调优的核心目标 11:23 实战-22-GC调优的常用工具 12:05 实战-23-GC调优的常见工具2 14:25 实战-24-常见的GC模式 13:38 实战-25-基础JVM参数的设置 28:31 实战-26-垃圾回收器的选择 18:04 实战-27-垃圾回收参数调优 07:56 实战-28-实战-GC调优和内存调优 30:43 实战-29-性能问题的现象和解决思路 10:49 实战-30-定位进程CPU占用率高的问题 18:52 实战-31-接口响应时间很长问题的定位 14:44 实战-32-火焰图定位接口响应时间长的问题 12:03 实战-33-死锁问题的检测 14:37 实战-34-基准测试框架JMH的使用 28:24 实战-35-实战-性能调优 26:36 高级-01-GraalVM介绍 12:13 高级-02-GraalVM的两种运行模式 15:43 高级-03-使用SpringBoot3构建GraalVM应用 15:08 高级-04-将GraalVM应用部署到函数计算 25:13 高级-05-将GraalVM应用部署到Serverless 09:14 高级-06-参数优化和故障诊断 22:31 高级-07-垃圾回收器的技术演进 13:09 高级-08-ShenandoahGC 22:50 高级-09-ZGC 14:35 高级-10-实战案例-内存不足时的垃圾回收测试 09:47 高级-11-JavaAgent技术 12:16 高级-12-JavaAgent环境搭建 15:24 高级-13-查看内存的使用情况 18:48 高级-14-生成内存快照 13:47 高级-15-获取类加载器的信息 16:26 高级-16-打印类的源码 18:00 高级-17-使用ASM增强方法 29:45 高级-18-使用ByteBuddy打印方法执行的参数和耗时 21:55 高级-19-APM系统和数据采集 24:30 原理-01-栈上的数据存储 15:05 原理-02-boolean在栈上的存储方式 22:48 原理-03-对象在堆上的存储1 17:27 原理-04-对象在堆上的存储2 25:14 原理-05-方法调用的原理1-静态绑定 19:26 原理-06-方法调用的原理2-动态绑定 15:25 原理-07-异常捕获的原理 12:00 原理-08-JIT即时编译器 14:49 原理-09-JIT即时编译器优化手段1-方法内联 16:49 原理-10-JIT即时编译器优化手段2-逃逸分析 09:03 原理-11-g1垃圾回收器原理-年轻代回收 27:57 原理-12-g1垃圾回收器原理-混合回收 17:24 原理-13-ZGC原理 26:27 原理-14-ShenandoahGC原理 09:39 面试-01-什么是JVM 16:38 面试-02-字节码文件的组成 15:02 面试-03-什么是运行时数据区 20:09 面试-04-哪些区域会出现内存溢出 11:56 面试-05-JDK6-8内存区域上的不同 14:36 面试-06-类的生命周期 17:17 面试-07-什么是类加载器 17:05 面试-08-什么是双亲委派机制 12:15 面试-09-如何打破双亲委派机制 18:10 面试-10-tomcat的自定义类加载器 31:18 面试-11-如何判断堆上的对象有没有被引用 10:05 面试-12-JVM中都有哪些引用类型 16:58 面试-13-theadlocal中为什么要使用弱引用 12:16 面试-14-有哪些垃圾回收算法 24:54 面试-15-有哪些常用的垃圾回收器 18:55 面试-16-如何解决内存泄漏问题 23:52 面试-17-常见的JVM参数 11:11 这是目前我学习的视频集合,要不要全看,或者少了什么,有哪些重要内容需要进行学习汇总或刷题或通过小实例验证
最新发布
10-02
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值