垃圾回收机制

 

垃圾回收机制

、什么是垃圾回收

       C++中,程序员需要自己写析构函数来释放内存,一旦忘记,会导致内存泄漏。Java语言对内存的分配管理是通过JVM内部机制决定的。程序员可以不关心其处理。jvm的一个系统级线程会自动检查,释放无用对象占用的内存。

二、垃圾回收机制原理

       垃圾回收器的运行是间歇的,当jvm感到内存紧缺时执行(可以通过System.gc()来强制回收垃圾,会在短期内执行(不能保证下达命令之后立即执行)。)如果一个对象没有任何线程访问它,那么它就符合了垃圾回收的条件。垃圾回收按照特定的垃圾收集算法(自适应的、分代的、停止-复制、标记-清扫)来实现资源自动回收的功能。

三、相关算法

       垃圾回收算法有多种,但是整体思路都是:发现无用对象->回收无用对象占用的空间。

正在执行的java程序可以访问的引用变量的集合(局部变量、参数、类变量)被称为根集(root set),首先确认从根可到达的和间接可到达的对象为活动对象,而根集通过任何路径都不可到达的对象为无用对象,被回收。

常见算法有一下几种:

1 引用计数法(Reference Counting Collector)
  引用计数法是唯一没有使用根集的垃圾回收的法,该算法使用引用计数器来区分存活对象和不再使用的对象。一般来说,堆中的每个对象对应一个引用计数器。当每一次创建一个对象并赋给一个变量时,引用计数器置为1。当对象被赋给任意变量时,引用计数器每次加1当对象出了作用域后(该对象丢弃不再使用),引用计数器减1,一旦引用计数器为0,对象就满足了垃圾收集的条件。

  基于引用计数器的垃圾收集器运行较快,不会长时间中断程序执行,适应必须实时运行的程序。但引用计数器增加了程序执行的开销,因为每次对象赋给新的变量,计数器加1,而每次现有对象出了作用域生,计数器减1


2
tracing算法(Tracing Collector)
  tracing算法是为了解决引用计数法的问题而提出,它使用了根集的概念。基于tracing算法的垃圾收集器从根集(位于堆栈和静态区)开始扫描,识别出哪些对象可达,哪些对象不可达,并用某种方式标记可达对象,例如对每个可达对象设置一个或多个位。全部标记完成,堆无标志的对象进行清理和释放。在扫描识别过程中,基于tracing算法的垃圾收集也称为标记和清除(mark-and-sweep)垃圾收集器。

jvm早期版本使用,缺点:清理后堆空间不连续,造成碎片。

 

3compacting算法(Compacting Collector)
  为了解决堆碎片问题,基于tracing的垃圾回收吸收了Compacting算法的思想,在清除的过程中,算法将所有的对象移到堆的一端,堆的另一端就变成了一个相邻的空闲内存区,收集器会对它移动的所有对象的所有引用进行更新,使得这些引用在新的位置能识别原来 的对象。在基于Compacting算法的收集器的实现中,一般增加句柄和句柄表。

 

4copying算法(Coping Collector)
  该算法的提出是为了克服句柄的开销和解决堆碎片的垃圾回收。它开始时把堆分成一个对象面和多个空闲面, 程序从对象面为对象分配空间,当对象满了,基于coping算法的垃圾收集就从根集中扫描活动对象,并将每个活动对象复制到空闲面(使得活动对象所占的内存之间没有空闲洞),这样空闲面变成了对象面,原来的对象面变成了空闲面,程序会在新的对象面中分配内存。

  一种典型的基于coping算法的垃圾回收是stop-and-copy算法,它将堆分成对象面和空闲区域面,在对象面与空闲区域面的切换过程中,程序暂停执行。

缺点:当程序进入稳定状态,产生的垃圾较少,此时还进行复制,就很浪费。

 

5generation算法(Generational Collector)
  stop-and-copy垃圾收集器的一个缺陷是收集器必须复制所有的活动对象,这增加了程序等待时间,这是coping算法低效的原因。在程序设计中有这样的规律:多数对象存在的时间比较短,少数的存在时间比较长。因此,generation算法将堆分成两个或多个,每个子堆作为对象的一代(generation)。由于多数对象存在的时间比较短,随着程序丢弃不使用的对象,垃圾收集器将从最年轻的子堆中收集这些对象。在分代式的垃圾收集器运行后,上次运行存活下来的对象移到下一最高代的子堆中,由于老一代的子堆不会经常被回收,因而节省了时间。

 

6adaptive算法(Adaptive Collector)
  在特定的情况下,一些垃圾收集算法会优于其它算法。基于Adaptive算法的垃圾收集器就是监控当前堆的使用情况,并将选择适当算法的垃圾收集器。 

 

四、优缺点

       优点:自动释放内存,简化编程,提高编程效率。防止了内存泄漏,保证安全。

       缺点:jvm必须追踪程序中有用的对象,释放无用对象,这个过程要花费处理器时间,开销影响程序的性能。采用的算法的优劣也对垃圾回收的效率有很大的影响。

五、透视垃圾回收

1、使用命令行java -verbosegc classfile查看java堆内存情况

HelloWorld.java如下:
class HelloWorld{

      public static void main(String[] args){

       new HelloWorld();

       System.gc();

       System.runFinalization();

       }

}
 
在命令行执行
java –verbosegc HelloWorld
执行结果:[Full GC 210K->133K(5056K)
0.0207951 secs]

  机器的环境为,Windows XP + JDK1.6.0,箭头前后的数据210K133K分别表示垃圾收集GC前后所有存活对象使用的内存容量,说明有210K-133K=77K的对象容量被回收,括号内的数据5056K为堆内存的总容量,收集所需要的时间是0.0207951秒(这个时间在每次执行的时候会有所不同)。


2
finalize方法(protected void finalize() throws Throwable

Object中被定义。当 Java虚拟机已确定尚未终止的任何线程无法再通过任何方法访问此对象时,由对象的垃圾回收器调用此方法。

子类可以重写 finalize 方法,以配置系统资源或执行其他清除。finalize 方法可以采取任何操作,其中包括再次使此对象对其他线程可用;不过,finalize 的主要目的是在不可撤消地丢弃对象之前执行清除操作。例如,表示输入/输出连接的对象的 finalize 方法可执行显式 I/O 事务,以便在永久丢弃对象之前中断连接。

finalize()方法在对象被垃圾回收之前被垃圾回收器调用一次,并且在任何对象上最多只会被垃圾回收器调用一次。Java 编程语言不保证哪个线程将调用某个给定对象的 finalize 方法。但可以保证在调用 finalize 时,调用 finalize 的线程将不会持有任何用户可见的同步锁定。如果 finalize 方法抛出未捕获的异常,那么该异常将被忽略,并且该对象的终结操作将终止。

之所以要使用finalize(),是因为可能在finalize()内部的一个固有方法中调用Cmalloc()系列函数,用它分配存储空间。而且除非调用了free(),否则存储空间不会得到释放,从而造成内存"漏洞"的出现。也就是说我们不能过多地使用finalize(),它并不是进行普通清除工作的理想场所。

下面这个例子向大家展示了垃圾收集所经历的过程,并对前面的陈述进行了总结。

class Chair {
 
static boolean gcrun = false;
 
static boolean f = false;
 
static int created = 0;
 
static int finalized = 0;
 
int i;
 
Chair() {
  
i = ++created;
  
if(created == 47)
   
System.out.println("Created 47");
 
}
 
protected void finalize() {
  
if(!gcrun) {
   
gcrun = true;
   
System.out.println("Beginning to finalize after " + created + " Chairs have been created");
  
}
  
if(i == 47) {
   System.out.println("Finalizing Chair #47
" +"Setting flag to stop Chair creation");
   
f = true;
  
}
  
finalized++;
  
if(finalized >= created)
   
System.out.println("All " + finalized + " finalized");
 
}
}

public class Garbage {
 
public static void main(String[] args) {
  
if(args.length == 0) {
   
System.err.println("Usage: /n" + "java Garbage before/n or:/n" + "java Garbage after");
   
return;
  
}
  
while(!Chair.f) {
   
new Chair();
   
new String("To take up space");
  
}
  
System.out.println("After all Chairs have been created:/n" + "total created = " + Chair.created +
"
total finalized = " + Chair.finalized);
  
if(args[0].equals("before")) {
    
System.out.println("gc():");
    
System.gc();
    
System.out.println("runFinalization():");
    
System.runFinalization();
  
}
  
System.out.println("bye!");
  
if(args[0].equals("after"))
   
System.runFinalizersOnExit(true);
 
}
}

  上面这个程序创建了许多Chair对象,而且在垃圾收集器开始运行后的某些时候,程序会停止创建Chair。由于垃圾收集器可能在任何时间运行,所以我们不能准确知道它在何时启动。因此,程序用一个名为gcrun的标记来指出垃圾收集器是否已经开始运行。利用第二个标记fChair可告诉main()它应停止对象的生成。这两个标记都是在finalize()内部设置的,它调用于垃圾收集期间。另两个static变量--created以及finalized--分别用于跟踪已创建的对象数量以及垃圾收集器已进行完收尾工作的对象数量。最后,每个Chair都有它自己的(非staticint i,所以能跟踪了解它具体的编号是多少。编号为47Chair进行完收尾工作后,标记会设为true,最终结束Chair对象的创建过程。 
 
  


六、垃圾回收机制特点及使用注意:

  (1)垃圾收集发生的不可预知性:由于实现了不同的垃圾收集算法和采用了不同的收集机制,所以它有可能是定时发生,有可能是当出现系统空闲CPU资源时发生,也有可能是和原始的垃圾收集一样,等到内存消耗出现极限时发生,这与垃圾收集器的选择和具体的设置都有关系。


  (2)垃圾收集的精确性:主要包括2 个方面:(a)垃圾收集器能够精确标记活着的对象;(b)垃圾收集器能够精确地定位对象之间的引用关系。前者是完全地回收所有废弃对象的前提,否则就可能造成内存泄漏。而后者则是实现归并和复制等算法的必要条件。所有不可达对象都能够可靠地得到回收,所有对象都能够重新分配,允许对象的复制和对象内存的缩并,这样就有效地防止内存的支离破碎。


  (3)现在有许多种不同的垃圾收集器,每种有其算法且其表现各异,既有当垃圾收集开始时就停止应用程序的运行,又有当垃圾收集开始时也允许应用程序的线程运行,还有在同一时间垃圾收集多线程运行。


  (4)垃圾收集的实现和具体的JVM 以及JVM的内存模型有非常紧密的关系。不同的JVM 可能采用不同的垃圾收集,而JVM 的内存模型决定着该JVM可以采用哪些类型垃圾收集。现在,HotSpot 系列JVM中的内存系统都采用先进的面向对象的框架设计,这使得该系列JVM都可以采用最先进的垃圾收集。


  (5)随着技术的发展,现代垃圾收集技术提供许多可选的垃圾收集器,而且在配置每种收集器的时候又可以设置不同的参数,这就使得根据不同的应用环境获得最优的应用性能成为可能。


  针对以上特点,我们在使用的时候要注意:


  (1)不要试图去假定垃圾收集发生的时间,这一切都是未知的。比如,方法中的一个临时对象在方法调用完毕后就变成了无用对象,这个时候它的内存就可以被释放。


  (2Java中提供了一些和垃圾收集打交道的类,而且提供了一种强行执行垃圾收集的方法--调用System.gc(),但这同样是个不确定的方法。Java 中并不保证每次调用该方法就一定能够启动垃圾收集,它只不过会向JVM发出这样一个申请,到底是否真正执行垃圾收集,一切都是个未知数。


  (3)挑选适合自己的垃圾收集器。一般来说,如果系统没有特殊和苛刻的性能要求,可以采用JVM的缺省选项。否则可以考虑使用有针对性的垃圾收集器,比如增量收集器就比较适合实时性要求较高的系统之中。系统具有较高的配置,有比较多的闲置资源,可以考虑使用并行标记/清除收集器。


  (4)关键的也是难把握的问题是内存泄漏。良好的编程习惯和严谨的编程态度永远是最重要的,不要让自己的一个小错误导致内存出现大漏洞。


  (5)尽早释放无用对象的引用。大多数程序员在使用临时变量的时候,都是让引用变量在退出活动域(scope)后,自动设置为null,暗示垃圾收集器来收集该对象,还必须注意该引用的对象是否被监听,如果有,则要去掉监听器,然后再赋空值。



 

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值