GC是Java中Garbage Collection (垃圾回收)的简称。
原因:New对象时,会在堆内存中划出一定大小的内存给这个对象。随着应用程序的运行,堆逐渐被填满,达到一定程度时,没有连续的内存可以来存放New的对象,这种时候JVM就会启动GC来回收 “没用”的内存。
作用:回收 堆内存 中没有引用指向的对象所占的内存,达到重新利用这些内存的目的。
目标:
1、快速释放不可达对象所占用的内存,防止应用程序出现OOM的错误。
2、回收内存时,对应用程序的影响要小。
方法:
1、引用计数法。对象存在一个引用的话其标记为1,没有引用的话标记为0,回收标记为0的对象。
优点:一旦发现某对象的引用为0,立即回收,并且可以立即访问被回收的内存;
缺点:维护未被引用的内存不需要消耗很大的资源,但是保持并不断更新引用的代价比较大,即保持引用的准确性是一个难题。另外一点是对循环引用结构的处理,两个对象互相引用,但没有其他对象引用他们的情况。
2、引用跟踪法。从某些初始存活对象出发,跟踪从这些对象发出的引用,标记为LIVE状态,遍历整个堆后才开始回收未被标记的对象。
优点:可以解决循环引用结构的问题;
缺点:由于标记阶段的存在,无法立即释放未被标记的对象。
引用跟踪法的常见算法
1、拷贝垃圾回收器
有一个 from区和一个 to区。将 from区的LIVE对象拷贝到 to区,然后回收整个 from区。下一次分配内存的时候,会从 to区开始分配。from区和 to区实现交换。
优点:LIVE对象在 to区会被重新分配,紧凑存放,避免了碎片化。
缺点:在执行过程中应用程序是被挂起的,stop-the-world。因此会对应用程序有较大的影响。典型情况, from区都为LIVE对象时, to区必须足够大。
2、标记-清理垃圾回收器
当所有对象标记了一次之后,会开始清理阶段,此时会遍历整个堆,而不仅仅是LIVE对象的集合。回收的内存会放在空闲列表中,可存在多个,一般按照内存块的大小排列。下一次New对象,会先从空闲列表中找出大小合适的内存块分配给对象。
优点:对应用程序的影响相对拷贝垃圾回收器来说较小。
缺点 :标记阶段的耗时取决于跟踪LIVE对象所有引用的时间,清理阶段取决于整个堆的大小。在两阶段完成前,应用程序处于无事可做的状态。
标记-清理垃圾回收器可分为 并行垃圾回收器 和 串行垃圾回收器 两种。
并行垃圾回收:垃圾回收是多线程并行的。大部分情况下 应用程序会挂起,stop-the-world。
并发垃圾回收:垃圾回收可以跟应用程序线程同时运行。需要有足够多的时间跟踪LIVE对象的引用,并在程序出现OOM之前回收内存。所以进行垃圾回收的时机选择很重要,另一个问题是何时执行一个需要完整堆快照的操作是安全的,因为转换阶段可能是不安全的。比如 应用程序刚刚修改过一块未被标记的区域,使该区域由非LIVE变成了LIVE。