深入理解JVM(三)——垃圾收集器

13 篇文章 0 订阅

需要了解GC吗?

Q:需要了解GC和内存分配吗?
A:当需要排查各种内存溢出,内存泄露问题时;当垃圾回收成为系统高并发的瓶颈时

哪些内存需要回收?

程序计数器,虚拟机栈,本地方法栈随着线程生而生,线程灭而灭,栈帧随着方法的进入和退出而进栈和出栈。基本上类结构确定下来就已知了。
Java堆和方法区则不同,只有运行时才知道要创建哪些对象,这部分内存的分配和回收是动态的。

对象已死吗?

  • 引用计数算法

    给对象中添加一个引用计数器,每当有一个地方引用它,计算器加1;引用失效时,计算器减1。任何时刻计算器为0的对象就是不可能再被使用的。
    无法解决对象之间相互循环引用的问题

  • 可达性分析算法

    通过一系列的称为”GC Roots”的对象作为起点,从这些节点开始向下搜索,搜索走过的路径称为引用链,当一个对象到达”GC Roots”没有任何引用链相连,则对象不可用。

    GC Roots对象包括

    • 虚拟机栈(栈帧中的本地变量表)中引用的对象
    • 方法区中类静态属性引用的对象
    • 方法区中常量引用的对象
    • 本地方法栈中JNI(Native方法)引用的对象

    Java中引用的概念

    • 强引用,在程序代码中普遍存在,如new,只要强引用存在,垃圾收集器永远不会回收掉引用的对象
    • 软引用,描述一些还有用但并非必需的对象。对于软引用关联的对象,系统在将要发出内存溢出异常之前,将会把这些对象纳入回收范围中进行第二次回收。JDK提供SoftReference类来实现软引用。
    • 弱引用,描述非必需的对象,被弱引用关联的对象只能生存到下一次垃圾收集发生之前。JDK提供WeakReference类来实现弱引用。
    • 虚引用,一个对象是否有虚引用存在,完全不会对其生命周期产生影响,也无法通过虚引用取得一个实例。为对象设置虚引用的唯一目的是为了能在这个对象被垃圾回收时收到一个系统通知。JDK提供PhantomReference类来实现虚引用。

真正宣告一个对象的死亡,至少要经历两次标志过程。第一次可达性分析后发现没有与GC Roots连接的引用链,那么它会被第一次标记并且进行一次筛选,条件为对象是否有必要执行finalize()方法。(对象没有覆盖该方法或者该方法已调用,则虚拟机视为没必要执行)
有必要执行finalize则放在F-Queue中,并由虚拟机稍后建立低优先级的线程去执行。保证触发这个方法但是不保证等待它运行结束。(防止一个方法执行缓慢,死循环,阻塞队列)
稍后GC会对F-Queue中的对象进行第二次标记,也是对象逃脱GC的最后一次计划,可以把自己(this)赋值给某个类的变量就可以重新与引用链上的对象关联了。

回收方法区

HotSpot中的永久代,性价比较低。在堆中,特别是新生代,一次垃圾回收可以回收70%-95%的空间。
永久代的垃圾收集远低于此,永久代的垃圾收集包括废弃的常量和无用的类。

  • 废弃的常量
    与回收Java堆中的对象非常相似,将入字符串”abc”已经进入常量池,而没有任何String对象引用常量池中的”abc”常量,也没有其它地方引用这个字面量,此时GC,该常量会被清理出常量池。
  • 无用的类
    有三个条件,该类的所有实例都已经被回收,加载该类的ClassLoader已经被回收,该类对应的java.lang.class对象没有在任何地方别引用,无法在任何地方通过反射访问该类的方法。

垃圾收集算法

  • 标记-清除算法

    首先标记出所有要回收的对象,在标记完成后统一回收所有被标记的对象。存在两个问题,效率问题,标记和清除这两个过程效率都不高;另一个是空间问题,产生大量的不连续的内存碎片。

  • 复制算法

    将内存按照容量划分成大小相等的两块,每次只使用其中的一块,用完之后将存活的对象复制到另一块上,然后将已使用过的内存空间一次清理掉。实现简单,运行高效,只是将内存缩小为原来的一半了。

  • 标记-整理算法

    复制收集算法在对象存活较高时就要进行多的复制操作,效率会下降。标记-整理算法标记过程依然按照之前的标记,但是不是直接对可回收对象进行清理,而是所有存活的对象向一端移动,然后直接清理掉端边界以外的内存。

  • 分代收集算法
    根据对象存活周期的不同将内存划分为几块。一般Java堆分为新生代和老年代,根据特点采用最适当的收集算法。新生代大多朝生夕死,采集复制算法;老年代对象存活效率高,采用标记-清除或者标记-整理算法进行回收。

HotSpot算法实现

stop the world

GC Roots即全局性引用(常量及类静态属性),与执行上下文(栈帧中的本地变量表),进行可达性分析时,会造成停顿。因为必须保持一致性,不能出现分析过程中对象引用关系还在不断的变化,即stop the world。即使CMS收集器中,枚举根节点也是必须要停顿的。

OopMap

HotSpot用一组称为OopMap的数据结构,代替跟节点的枚举。在类加载完成的时候,将对象内什么偏移量上是什么类型计算出来,在JIT编译过程中,也会在特定的位置记录下栈和寄存器中的哪些位置引用,这样GC扫描时就可以直接知道这些信息啦。

SafePoint

并不是每一条指令都生成OopMap,上文已经说过只有到“特定的位置”才记录这些信息,这些位置称为安全点(SafePoint),也就是说程序不是所有的地方都能停止下来GC,而是只有到了安全点才能GC。
安全点的选择以程序是否具备长时间执行的特征为标准选定,因为指令执行的时间非常短,长时间执行明显的特征就是指令序列复用,即方法调用,循环跳转,异常跳转等。

多线程与SafePoint

如果保证GC时所有线程都达到SafePoint呢?

  • 抢先式中断

    GC发生时,不需要线程配合,首先将所有线程全部中断,如果发现有线程中断的地方不在SafePoint,则恢复线程,让其执行到SafePoint。(该方式极少被JVM采用)

  • 主动式中断

    GC需要中断线程时,不直接对线程操作,仅仅简单地设置一个标志,各个线程执行时主动去轮循这个标志,发现中断标志为true就自己中断挂起。轮循的标志的地方和SafePoint是重合的,另外加上创建对象需要分配内存的地方。

SafeRegion

SafePoint看似完美解决了进入GC的问题,但是如果有的线程不执行怎么办?线程处于sleep或者blocked状态,没有分配到CPU时间,那么就无法响应中断请求。
安全区域是指在一段代码片段中,引用关系不会发生变化,这个区域任何地方开始GC都是安全的。
线程执行到SafeRegion时,标志自己已经进入SafeRegion,这时发生GC,就不用管状态为SafeRegion的线程。在线程离开SafeRegion时,检查JVM是否完成根节点的枚举,如果完成线程继续执行,如果没有则等待。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值