GC机制原理以及C#、Unity、UE中的相关应用的总结

GC,垃圾回收机制,通过识别堆上动态开辟的内存的使用情况,确定那些内存区域需要被回收。
中间涉及到的问题主要有:

  1. 内存标记
  2. 内存碎片
  3. 内存压缩
  4. 指针修复
  5. 内存泄漏
  6. 反复释放

GC算法

标记清除法(mark-swap)

  • 优点:
    • 不需要移动对象,适用于存活对象较多的情况
  • 缺点
    • 标记和清除清除过程效率不高
    • 产生内存碎片

标记整理法

  • 优点
    • 消除内存碎片
  • 缺点
    • GC耗时增加,需要复制到内存到新地址
    • 需要修复指针

拷贝算法(copying collecter)

  • 原理:
    • 将内存分成两块:工作区空闲区
    • 触发GC时,将工作区中存活的对象拷贝到空闲区中,同时切换工作区和空闲区
  • 优点:
    • 标记阶段和复制阶段可以同时执行
    • 复制时顺序分配内存,只需要移动栈顶指针即可
    • 没有内存碎片
  • 缺点
    • 可用的内存空间减半
  • 适用范围:分代算法中的Gen0、Gen1等新生代

C#中的GC原理

1. Mark-Compact 标记压缩算法
  1. .Net使用
  2. 分成两个过程
    • 标记:标记**不可回收(存活)**的对象,回收其余对象
    • 压缩:将存活的内存重新从基地址开始重新连续排序,解决内存碎片化问题
  3. 具体过程:
    • 线程挂起
    • 确定roots
    • 创建reachable object graph,用于确定存活对象
    • 对象回收
    • heap压缩
    • 指针修复
  4. roots对象
    • 静态对象
    • 线程正在使用的临时对象
2.Generational 分代算法
  1. 理论前提
    1. 统计学规律:新创建的生命周期短,早期创建的老对象生命周期长
    2. 部分内存回收比全部内存回收快
    3. 新创建的对象间关联性强,heap上分配的对象大多是连续的,Cache命中率高
  2. .Net分为了三个时代:Gen0、Gen1、Gen2
    • Gen0 heap内存达到阈值后,触发Gen0的GC,存活对象进入Gen1
    • Gen1 heap内存达到阈值后,触发Gen0和Gen1的GC,存活对象进入Gen2。
    • Gen2 heap达到阈值后,会触发Gen0、Gen1、Gen2的GC,即为Full GC,成本巨大
    • Gen2内存大无上限,Gen1+Gen0为16M
    • t(Gen0):几毫秒,t(Gen1):十几毫秒,t(Gen2)能到数秒
    • 应控制频率:p(Gen0):p(Gen1):p(Gen3)=1:10:100
3.Finalization Queue和Freachable Queue
  1. 用于处理析构函数
  2. 标记完成以后,会从垃圾中检索含有析构函数的对象,并将指针添加到Finalization Queue中,这个过程成为对象复生,之后Finalization Queue会调用对象的析构函数并从队列中剔除,之后对象才会真正死去。

.NET中GC存在的问题

  1. 只能释放托管资源,无法释放非托管资源
  2. GC的触发时机不确定性,因此产生了IDispose接口和using关键字
    • IDispose:用于释放非托管资源
    • using:简化内存管理

Java中的GC

java中的引用

  • 强引用
  • 软引用
  • 弱引用
  • 虚引用(phantom reference,幻影引用)

算法

1.引用计数法
  • 对象创建时,引用计数为1,之后每次被引用,计数+1,引用失效时,计数-1.计数为0时,对象释放
  • 优点:逻辑简单、效率高、
  • 缺点:
    • 无法检测循环引用
    • 引用计数自身的内存占用
    • 修改引用计数时的原子性操作要求
    • 非实时性,一个引用变化引起的一系列链式反应
  • JVM早期GC机制
2.根搜索算法(Tracing Collector)

根搜索算法是目前JVM所使用的的算法
实现原理:

  1. 确定根集Roots
  2. 使用roots作为根节点,向下遍历所有的引用节点,形成引用链
  3. 根据对象是否再引用链中判断对象是否存活

.NET和java都是使用该原理

java堆内存
  • 分配策略
    • 对象优先分配在eden中
    • 大对象直接分配再老年代
    • 长期存活的对象再老年代
  • 新生代(Minor GC):非常频繁,只有少量对象存活,适用于复制算法
  • 老年代(major GC):内存占用大,对象存活率高,适用于标记整理(标记压缩)法

Unity中的GC机制

Unity使用的GC算法

Unity脚本后端基于Mono实现和IL2CPP实现两种,两者采用的GC机制都是Mark-Swap
实现过程为:挂起线程-roots遍历-标记-清理-恢复线程,因为不存在压缩的步骤,因此线程卡顿现象较轻,但是存在内存碎片问题。
同时Unity中存在托管内存非托管内存,GC只影响托管内存,非托管内存需要手动维护

优化GC带来的影响

GC时会挂起线程,因此优化GC的重点在与减少CPU时间占用
三个方面

  • 减少垃圾回收器的运行时间
  • 降低垃圾回收器的触发频率
  • 提前触发垃圾回收器,避免关键时刻触发GC

常见热点与优化方式

  • 使用StringBuilder替代String做字符串拼接
  • 谨慎使用闭包,闭包的实质就是一个含有数个字段(捕获的上下文变量)和一个函数的对象
  • 装箱拆箱
  • 空表、空数组
  • 协程中产生的GC
    • new WaitXXX对象
  • LINQ中产生装箱拆箱

增量式GC

  • Unity2018以后推出,为分布式GC
  • 将GC的过程均衡分配到多帧当中,消除毛刺
  • 存在的问题:
    • 如果对象的引用在GC的两帧过程中发生改变,会导致之前的GC工作作废,需要重新遍历标记。
    • 同时增量式GC需要额外内存开销来确定对象引用是否发生变化。
  • 因此需要考量负优化的情况

Unity中GC存在的问题

  • 内存中存在大量对象是,GC耗时长
  • GC时机的不确定性可能会加剧毛刺现象
  • 由于使用Mark-Swap算法,因此存在内存碎片问题。内存碎片存在两个问题:
    • 实际能够使用内存大小小于内存的实际大小
    • 申请的内存被分割为很小的不连续的内存块,Caching命中率低
    • 频繁触发GC回收器

UE中的GC机制

和Unity类似,UE依然使用了Mark-Swap机制
被UPROPERTY宏修饰或在AddReferencedObjects函数被手动添加引用的UObject*成员变量,才能被GC识别和追踪

  • 可以通过调用AddToRoot函数来组织对象被GC
  • 通过对象被设置为null来判断回收情况
  • 支持阻塞分帧两种方式执行GC
  • UE通过GC锁的机制,来实现类似于.NET、JVM等虚拟机线程挂起的操作
  • 可以通过Tick的方式周期性执行GC,也可以特殊情况下一次性调用Full GC

参考链接:

  • 1
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值