GC,垃圾回收机制,通过识别堆上动态开辟的内存的使用情况,确定那些内存区域需要被回收。
中间涉及到的问题主要有:
- 内存标记
- 内存碎片
- 内存压缩
- 指针修复
- 内存泄漏
- 反复释放
GC算法
标记清除法(mark-swap)
- 优点:
- 不需要移动对象,适用于存活对象较多的情况
- 缺点
- 标记和清除清除过程效率不高
- 产生内存碎片
标记整理法
- 优点
- 消除内存碎片
- 缺点
- GC耗时增加,需要复制到内存到新地址
- 需要修复指针
拷贝算法(copying collecter)
- 原理:
- 将内存分成两块:工作区和空闲区
- 触发GC时,将工作区中存活的对象拷贝到空闲区中,同时切换工作区和空闲区
- 优点:
- 标记阶段和复制阶段可以同时执行
- 复制时顺序分配内存,只需要移动栈顶指针即可
- 没有内存碎片
- 缺点
- 可用的内存空间减半
- 适用范围:分代算法中的Gen0、Gen1等新生代
C#中的GC原理
1. Mark-Compact 标记压缩算法
- .Net使用
- 分成两个过程
- 标记:标记**不可回收(存活)**的对象,回收其余对象
- 压缩:将存活的内存重新从基地址开始重新连续排序,解决内存碎片化问题
- 具体过程:
- 线程挂起
- 确定roots
- 创建reachable object graph,用于确定存活对象
- 对象回收
- heap压缩
- 指针修复
- roots对象
- 静态对象
- 线程正在使用的临时对象
2.Generational 分代算法
- 理论前提
- 统计学规律:新创建的生命周期短,早期创建的老对象生命周期长
- 部分内存回收比全部内存回收快
- 新创建的对象间关联性强,heap上分配的对象大多是连续的,Cache命中率高
- .Net分为了三个时代:Gen0、Gen1、Gen2
- Gen0 heap内存达到阈值后,触发Gen0的GC,存活对象进入Gen1
- Gen1 heap内存达到阈值后,触发Gen0和Gen1的GC,存活对象进入Gen2。
- Gen2 heap达到阈值后,会触发Gen0、Gen1、Gen2的GC,即为Full GC,成本巨大
- Gen2内存大无上限,Gen1+Gen0为16M
- t(Gen0):几毫秒,t(Gen1):十几毫秒,t(Gen2)能到数秒
- 应控制频率:p(Gen0):p(Gen1):p(Gen3)=1:10:100
3.Finalization Queue和Freachable Queue
- 用于处理析构函数
- 标记完成以后,会从垃圾中检索含有析构函数的对象,并将指针添加到Finalization Queue中,这个过程成为对象复生,之后Finalization Queue会调用对象的析构函数并从队列中剔除,之后对象才会真正死去。
.NET中GC存在的问题
- 只能释放托管资源,无法释放非托管资源
- GC的触发时机不确定性,因此产生了IDispose接口和using关键字
- IDispose:用于释放非托管资源
- using:简化内存管理
Java中的GC
java中的引用
- 强引用
- 软引用
- 弱引用
- 虚引用(phantom reference,幻影引用)
算法
1.引用计数法
- 对象创建时,引用计数为1,之后每次被引用,计数+1,引用失效时,计数-1.计数为0时,对象释放
- 优点:逻辑简单、效率高、
- 缺点:
- 无法检测循环引用
- 引用计数自身的内存占用
- 修改引用计数时的原子性操作要求
- 非实时性,一个引用变化引起的一系列链式反应
- JVM早期GC机制
2.根搜索算法(Tracing Collector)
根搜索算法是目前JVM所使用的的算法
实现原理:
- 确定根集Roots
- 使用roots作为根节点,向下遍历所有的引用节点,形成引用链
- 根据对象是否再引用链中判断对象是否存活
.NET和java都是使用该原理
java堆内存
- 分配策略
- 对象优先分配在eden中
- 大对象直接分配再老年代
- 长期存活的对象再老年代
- 新生代(Minor GC):非常频繁,只有少量对象存活,适用于复制算法
- 老年代(major GC):内存占用大,对象存活率高,适用于标记整理(标记压缩)法
Unity中的GC机制
Unity使用的GC算法
Unity脚本后端基于Mono实现和IL2CPP实现两种,两者采用的GC机制都是Mark-Swap。
实现过程为:挂起线程-roots遍历-标记-清理-恢复线程,因为不存在压缩的步骤,因此线程卡顿现象较轻,但是存在内存碎片问题。
同时Unity中存在托管内存和非托管内存,GC只影响托管内存,非托管内存需要手动维护
优化GC带来的影响
GC时会挂起线程,因此优化GC的重点在与减少CPU时间占用
三个方面
- 减少垃圾回收器的运行时间
- 降低垃圾回收器的触发频率
- 提前触发垃圾回收器,避免关键时刻触发GC
常见热点与优化方式
- 使用StringBuilder替代String做字符串拼接
- 谨慎使用闭包,闭包的实质就是一个含有数个字段(捕获的上下文变量)和一个函数的对象
- 装箱拆箱
- 空表、空数组
- 协程中产生的GC
- new WaitXXX对象
- LINQ中产生装箱拆箱
增量式GC
- Unity2018以后推出,为分布式GC
- 将GC的过程均衡分配到多帧当中,消除毛刺
- 存在的问题:
- 如果对象的引用在GC的两帧过程中发生改变,会导致之前的GC工作作废,需要重新遍历标记。
- 同时增量式GC需要额外内存开销来确定对象引用是否发生变化。
- 因此需要考量负优化的情况
Unity中GC存在的问题
- 内存中存在大量对象是,GC耗时长
- GC时机的不确定性可能会加剧毛刺现象
- 由于使用Mark-Swap算法,因此存在内存碎片问题。内存碎片存在两个问题:
- 实际能够使用内存大小小于内存的实际大小
- 申请的内存被分割为很小的不连续的内存块,Caching命中率低
- 频繁触发GC回收器
UE中的GC机制
和Unity类似,UE依然使用了Mark-Swap机制
被UPROPERTY宏修饰或在AddReferencedObjects函数被手动添加引用的UObject*成员变量,才能被GC识别和追踪
- 可以通过调用AddToRoot函数来组织对象被GC
- 通过对象被设置为null来判断回收情况
- 支持阻塞和分帧两种方式执行GC
- UE通过GC锁的机制,来实现类似于.NET、JVM等虚拟机线程挂起的操作
- 可以通过Tick的方式周期性执行GC,也可以特殊情况下一次性调用Full GC
参考链接: