java垃圾回收算法之-标记清除

前言

垃圾自动回收机制的出现使编程更加的简单,使得我们不需要再去考虑内存分配和释放的问题,而是更加的专注在我们产品功能的实现上。但是我们还是需要花时间去了解下垃圾收集机制是怎么工作的,以便后面能够更好的进行我们应用的性能调优等。

目前最基本的垃圾收集算法有四种,标记-清除算法(mark-sweep),标记-压缩算法(mark-compact),复制算法(copying)以及引用计数算法(reference counting).而现代流行的垃圾收集算法一般是由这四种中的其中几种算法相互组合而成,比如说,对堆(heap)的一部分采用标记-清除算法,对堆(heap)的另外一部分则采用复制算法等等。今天我们主要来看下标记-清除算法的原理。

root对象

在标记清除算法中,会把如下对象称之为root对象

  1. 被栈中的变量(栈中存的是对象的引用)所引用的对象
  2. 被static变量引用的对象

可访问的对象

如果栈中有一个变量a引用了一个对象,那么该对象是可访问的,如果该对象中的某一个字段引用了另一个对象b,那么b也是可访问的。可访问的对象也称之为live对象

基本概念

在了解标记-清除算法前,我们先要了解几个基本概念。

首先是mutator和collector,这两个名词经常在垃圾收集算法中出现,collector指的就是垃圾收集器,而mutator是指除了垃圾收集器之外的部分,比如说我们应用程序本身。mutator的职责一般是NEW(分配内存),READ(从内存中读取内容),WRITE(将内容写入内存),而collector则就是回收不再使用的内存来供mutator进行NEW操作的使用。

第二个基本概念是关于mutator roots(mutator根对象),mutator根对象一般指的是分配在堆内存之外,可以直接被mutator直接访问到的对象,一般是指静态/全局变量以及Thread-Local变量(在Java中,存储在java.lang.ThreadLocal中的变量和分配在栈上的变量 - 方法内部的临时变量等都属于此类).

第三个基本概念是关于可达对象的定义,从mutator根对象开始进行遍历,可以被访问到的对象都称为是可达对象。这些对象也是mutator(你的应用程序)正在使用的对象。

算法原理

顾名思义,标记-清除算法分为两个阶段,标记(mark)和清除(sweep).

在标记阶段,collector从mutator根对象开始进行遍历,对从mutator根对象可以访问到的对象都打上一个标识,一般是在对象的header中,将其记录为可达对象。

而在清除阶段,collector对堆内存(heap memory)从头到尾进行线性的遍历,如果发现某个对象没有标记为可达对象-通过读取对象的header信息,则就将其回收。

从上图我们可以看到,在Mark阶段,从根对象1可以访问到B对象,从B对象又可以访问到E对象,所以B,E对象都是可达的。同理,F,G,J,K也都是可达对象。到了Sweep阶段,所有非可达对象都会被collector回收。同时,Collector在进行标记和清除阶段时会将整个应用程序暂停(mutator),等待标记清除结束后才会恢复应用程序的运行,这也是Stop-The-World这个单词的来历。

接着我们先看下一般垃圾收集动作是怎么被触发的,下面是mutator进行NEW操作的伪代码:

New():
    ref <- allocate()  //分配新的内存到ref指针
    if ref == null
       collect()  //内存不足,则触发垃圾收集
       ref <- allocate()
       if ref == null
          throw "Out of Memory"   //垃圾收集后仍然内存不足,则抛出Out of Memory错误
          return ref

atomic collect():
    markFromRoots()
    sweep(HeapStart,HeapEnd)

而下面是对应的mark算法:

markFromRoots():
    worklist <- empty
    for each fld in Roots  //遍历所有mutator根对象
        ref <- *fld
        if ref != null && isNotMarked(ref)  //如果它是可达的而且没有被标记的,直接标记该对象并将其加到worklist中
           setMarked(ref)
           add(worklist,ref)
           mark()
mark():
    while not isEmpty(worklist)
          ref <- remove(worklist)  //将worklist的最后一个元素弹出,赋值给ref
          for each fld in Pointers(ref)  //遍历ref对象的所有指针域,如果其指针域(child)是可达的,直接标记其为可达对象并且将其加入worklist中
          //通过这样的方式来实现深度遍历,直到将该对象下面所有可以访问到的对象都标记为可达对象。
                child <- *fld
                if child != null && isNotMarked(child)
                   setMarked(child)
                   add(worklist,child)

在mark阶段结束后,sweep算法就比较简单了,它就是从堆内存起始位置开始,线性遍历所有对象直到堆内存末尾,如果该对象是可达对象的(在mark阶段被标记过的),那就直接去除标记位(为下一次的mark做准备),如果该对象是不可达的,直接释放内存。

sweep(start,end):
    scan <- start
   while scan < end
       if isMarked(scan)
          setUnMarked(scan)
      else
          free(scan)
      scan <- nextObject(scan)

标记清除算法的优点和缺点 
1. 优点 
- 是可以解决循环引用的问题 
- 必要时才回收(内存不足时) 

2. 缺点: 
- 回收时,应用需要挂起,也就是stop the world。 
- 标记和清除的效率不高,尤其是要扫描的对象比较多的时候 
- 会造成内存碎片( 会导致明明有内存空间,但是由于不连续,申请稍微大一些的对象无法做到 ),如下图: 
这里写图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Java垃圾回收算法主要基于可达性分析和标记-清除两种算法。下面是对这两种算法的简要说明: 1. 可达性分析 (Reachability Analysis):这是Java垃圾回收的基础算法。它通过判断对象是否可以从根对象(如线程栈、静态变量等)访问到来确定对象的存活状态。如果一个对象不可达,则认为它是垃圾,可以被回收。 2. 标记-清除 (Mark and Sweep):这是最基本的垃圾回收算法之一。在标记阶段,垃圾回收器从根对象开始遍历所有可达对象,并将其标记为“存活”。在清除阶段,垃圾回收清除所有未被标记的对象,并回收它们所占用的内存空间。 除了标记-清除算法Java还使用了其他一些高级的垃圾回收算法,包括: 1. 复制算法 (Copying Algorithm):将堆内存分为两个区域,每次只使用其一个区域。当一个区域满了之后,将存活的对象复制到另一个区域,并清除当前区域的所有对象。 2. 标记-整理 (Mark and Compact):类似于标记-清除算法,但在清除阶段之后,它会将存活的对象移动到内存的一端,以便于分配连续的内存空间。 3. 分代算法 (Generational Algorithm):根据对象的存活时间将堆内存划分为不同的代。通常情况下,新创建的对象会被分配到年轻代,而存活时间较长的对象则会被转移到老年代。不同代使用不同的垃圾回收算法进行回收。 这些算法的选择取决于具体的应用场景和性能需求,Java垃圾回收器通常会根据当前堆内存的使用情况和对象的存活特性来选择合适的回收算法

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值