Java堆是被所有线程共享的一块内存区域,所有对象实例和数组都在堆上进行内存分配。为了进行高效的垃圾回收,虚拟机把堆内存划分成新生代(Young Generation)、老年代(Old Generation)和永久代(Permanent Generation)3个区域。
简单介绍
新生代:新创建的对象都是用新生代分配内存,Eden空间不足时,触发Minor GC,这时会把存活的对象转移进Survivor区。
老年代:老年代用于存放经过多次Minor GC之后依然存活的对象。
新生代的GC(Minor GC):新生代通常存活时间较短基于Copying算法进行回收,所谓Copying算法就是扫描出存活的对象,并复制到一块新的完全未使用的空间中,对应于新生代,就是在Eden和FromSpace或ToSpace之间copy。新生代采用空闲指针的方式来控制GC触发,指针保持最后一个分配的对象在新生代区间的位置,当有新的对象要分配内存时,用于检查空间是否足够,不够就触发GC。当连续分配对象时,对象会逐渐从Eden到Survivor,最后到老年代。
老年代的GC(Major GC/Full GC):老年代与新生代不同,老年代对象存活的时间比较长、比较稳定,因此采用标记(Mark)算法来进行回收,所谓标记就是扫描出存活的对象,然后再进行回收未被标记的对象,回收后对用空出的空间要么进行合并、要么标记出来便于下次进行分配,总之目的就是要减少内存碎片带来的效率损耗。
JAVA GC针对不同代对象的特点采取不同的GC方式,以下对基本GC方式做一个总结。
基本GC方法总结
Reference counting(引用计数)
引用计数的基本思想:为每个object存储一个计数RC,当有其他 reference指向它时,RC++;当其他reference与其断开时,RC - -;如 果RC==0,则回收它
优点:
引用计数方法的优点:简单、计算代价分散,“幽灵时间”短
缺点:
不全面(容易漏掉循环引用的数据)、
要持续 不断的计算(代价高)、
难以支持并发等。
Mark-Sweep(标记-清除)
标记清除:为每个object设定状态位(live/dead)并记录,即mark阶段;将 标记为dead的对象进行清理,即sweep可阶段
标记阶段:
从根开始,跟踪图形并在遇到的每个未标记对象中设置标记位。
在标记阶段结束时,未标记的对象是垃圾。聝
清除阶段:从底部开始清除
标记未设置:对象被回收
标记设置了:标记位清零
优点:
综合:自然收集循环垃圾
指针操作没有运行时开销
松散地耦合到mutator
不移动对象
-不会破坏任何mutator不变量
-优化友好
-只需要发现每个活动对象的一个引用(而不是必须找到每个引用)
缺点
停止/开始自然会导致破坏性停顿和漫长的僵尸时间。
复杂性是O(heap)而不是O(live)
-标记阶段访问每个活动对象
-在扫描阶段visited访问每个物体,活着或死亡
-降低居住率(堆占用率)
-收集器需要堆中的净空以避免颠簸
- 示例:如果堆已满,则需要进行大量标记,并且我们经常执行此操作碎片和标记堆栈溢出是问题
跟踪收集器必须能够找到根(与引用计数不同)
-这需要对运行时系统或编译器的合作有所了解。
Mark-Compact (标记-整理)
过程如下:
将标记放在您需要的object上(如同Mark-Sweep)。
将带有标记的任何东西移到库后面。
烧掉库前面的一切(它已经死了)。
Copying(复制策略)
GC是一个设置分区问题
标记位是定义两组的一种方式。
Mark-compact将实时集的成员物理移动到堆的不同部分
空闲指针标记可以覆盖的实时数据和内存之间的分界线
复制集合是一个更简单的解决方案:它挑选出活动对象并将它们复制到“复制”中。
将堆分成两半,称为semi-spaces,命名为Fromspaceand Tospace
在Tospace中分配对象
当Tospace满了
翻转semi-spaces的角色
选择Fromspace中的所有实时数据并将其复制到Tospace
通过在Fromspace副本中保留转发地址来保持共享
将Tospace对象用作工作队列
优点
免费压缩
对于所有对象大小,分配都非常便宜
空间检查是指针比较
只需增加自由指针即可分配
仅处理实时数据(通常是堆的一小部分)
固定空间开销
免费和扫描指针
转发地址可以写在用户数据上
综合:自然收集循环垃圾
简单地实现相当有效的复制GC
缺点
停止复制可能具有破坏性
需要两倍于其他简单收集器的地址空间
接触两倍的页面
权衡分裂
复制大型对象的成本
会重复复制长寿命数据
所有相关内容必须更新
移动对象可能会破坏mutator不变量
广度优先复制可能会扰乱位置模式