python、Java、go垃圾回收gc对比

python垃圾回收

  • 引用计数(主要方法)

    python里每一个东西都是对象,它们的核心就是一个结构体:PyObject。
    PyObject是每个对象必有的内容,其中ob_refcnt就是做为引用计数。
    当一个对象有新的引用时,它的ob_refcnt就会增加,当引用它的对象被删除,它的ob_refcnt就会减少。
    当引用计数为0时,该对象生命就结束了。
    

    优点:

    1. 简单
    2. 实时性:一旦没有引用,内存就直接释放了。不用像其他机制等到特定时机。实时性还带来一个好处:处理回收内存的时间分摊到了平时。

    缺点:

    1. 维护引用计数消耗资源
    2. 难以检测出对象之间的循环引用。同时,引用计数器增加了程序执行的开销。
  • 标记清除

    为了追踪容器对象,需要每个容器对象维护两个额外的指针,用来将容器对象组成一个双端链表,指针分别指向前后两个容器对象,方便插入和删除操作。
    python解释器(Cpython)维护了两个这样的双端链表,一个链表存放着需要被扫描的容器对象,另一个链表存放着临时不可达对象。
    标记阶段:遍历所有的对象,如果是可达的(reachable),也就是还有对象引用它,那么就标记该对象为可达;
    清除阶段:再次遍历对象,如果发现某个对象没有标记为可达,则就将其回收。
    

    优点:解决容器对象可能产生的循环引用问题

    缺点:

    1. 暂停整个应用程序,等待标记清除结束后才会恢复应用程序的运行。
    2. 不需要进行对象的移动,并且仅对不存活的对象进行处理,因此标记清除之后会产生大量不连续的内存碎片,空间碎片太多可能会导致以后在程序运行过程中需要分配较大对象时,无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。
    3. 标记和清除都需要遍历对象,效率低下
  • 分代回收

    基于这样的一个统计事实,对于程序,存在一定比例的内存块的生存周期比较短;
    而剩下的内存块,生存周期会比较长,甚至会从程序开始一直持续到程序结束。
    生存期较短对象的比例通常在 80%~90% 之间,
    这种思想简单点说就是:对象存在时间越长,越可能不是垃圾,应该越少去收集。
    这样在执行标记-清除算法时可以有效减小遍历的对象数,从而提高垃圾回收的速度。
    
    python gc给对象定义了三种世代(0,1,2),每一个新生对象在generation zero中,如果它在一轮gc扫描中活了下来,
    那么它将被移至generation one,在那里他将较少的被扫描,如果它又活过了一轮gc,它又将被移至generation two,在那里它被扫描的次数将会更少。
    
    当某一世代中被分配的对象与被释放的对象之差达到某一阈值的时候,就会触发gc对某一世代的扫描。
    值得注意的是当某一世代的扫描被触发的时候,比该世代年轻的世代也会被扫描。
    也就是说如果世代2的gc扫描被触发了,那么世代0,世代1也将被扫描,如果世代1的gc扫描被触发,世代0也会被扫描。
    

    优点:在循环引用对象的回收中,整个应用程序会被暂停,为了减少应用程序暂停的时间,通过“分代回收”以空间换时间的方法提高垃圾回收效率。

总结

python主要通过引用计数进行垃圾实时回收,辅助用暂停程序才会回收的标记清除方法,又通过分代回收作为标记清除的优化方式来缩短程序暂停的时长。

Java垃圾回收

  • 引用计数(新版已废弃)

  • 分代回收

    • 新生代
    • 老年代
      • 大对象直接进入老年代
      • 长期存活的对象将进入老年代
    • 永久代
      • 存放静态文件,如Java类、方法等
  • 标记清除

    • 最基础的收集算法,后面的收集算法都是基于该思路并对其缺点进行改进而得到的
  • 复制

    将可用内存按容量划分为大小相等的两块,每次只使用其中的一块。
    当这一块的内存用完了,就将还存活着的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。
    这样使得每次都是对整个半区进行内存回收,内存分配时也就不用考虑内存碎片等复杂情况,只要移动堆顶指针,按顺序分配内存即可,实现简单,运行高效。
    
    不过内存一分为2的做法严重浪费了内存空间,所以实际上会将新生代内存分为一块较大的Eden空间和两块较小的Survivor空间 ,每次使用Eden和其中一块Survivor。
    当回收时,将Eden和Survivor中还存活着的对象一次地复制到另外一块Survivor空间上,
    如果Survivor空间不够,则直接存到老年代,最后清理掉Eden和刚才用过的Survivor空间。
    HotSpot虚拟机默认Eden和Survivor的大小比例是 8:1,也就是每次新生代中可用内存空间为整个新生代容量的90% ( 80%+10% ),只有10% 的内存会被“浪费”。
    

    优点:适用于对象存活率低的场景,比如新生代。减少内存碎片。
    缺点:内存得不到充分利用,总有部分内存空间处于浪费状态。

  • 标记整理

    回收过程类似标记清除算法,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存。
    

    优点:适用于对象存活率高的场景(老年代)

    标记整理算法 VS 标记清除算法:

    • 标记清除算法不进行对象的移动,并且仅对不存活的对象进行处理;
    • 而标记整理算法会将所有的存活对象移动到一端,并对不存活对象进行处理,因此其不会产生内存碎片。
总结

java是分代之后,每一代实行不同的回收策略,新生代使用复制,老年代使用标记整理。

go垃圾回收

  • 引用计数

  • 标记清除

  • 三色标记

      是对标记阶段的改进,原理如下:
      1. 起初所有对象都是白色。
      2. 从根出发扫描所有可达对象,标记为灰色,放入待处理队列。
      3. 从队列取出灰色对象,将其引用对象标记为灰色放入队列,自身标记为黑色。
      4. 重复 3,直到灰色对象队列为空。此时白色对象即为垃圾,进行回收。
    

    优点:能够让用户程序和 mark 并发的进行

  • 复制

  • 分代

总结

go的三色标记是亮点,效率优于标记清除

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值