Java虚拟机浅谈——垃圾收集器与内存分配策略

  根搜索算法


算法的定义为:通过一系列名为“GC Roots”的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链(Reference Chain),当一个对象到GC Roots没有任何引用链相连,或者说不可达的时候,则证明此对象不可用。

在Java语言中,可以作为GC Roots的对象包括下面几种:

  • 虚拟机栈(栈帧中的本地变量表)中的引用的对象。

  • 方法区中的类静态属性引用的对象。

  • 方法区中的常量引用的对象。

  • 本地方法栈中JNI(即一般说的Native方法)的引用的对象

  引用


在早期的JDK定义中,引用的定义为,如果reference类型的数据中存储的数值代表的是另外一块内存的起始地址,就称这块内存代表着一个引用。但这样的定义方式过于纯粹,一个对象只有两种状态,即被引用或者没有被引用两种。对于一些缓存类型的数据,则显得有些鸡肋,更无法体现内存分配的价值。

之后JDK对于引用进行了概念扩充,将引用分为强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Weak Reference)、虚引用(Phantom Reference)四种,这四种引用强度依次逐渐减弱。

  • 强引用就是指在程序代码之中普遍存在的,类似“Object obj = new Object()”这类的引用,只要强引用还存在,垃圾收集器永远不会回收掉被引用的对象。

  • 软引用用来描述一些还有用,但并非必需的对象。对于软引用关联着的对象,在系统将要发生内存溢出异常之前,将会把这些对象列进回收范围之中并进行第二次回收。如果这次回收还是没有足够的内存,才会抛出内存溢出异常。在JDK 1.2之后,提供了SoftReference类来实现软引用。

  • 弱引用也是用来描述非必需对象的,但是它的强度比软引用更弱一些,被弱引用关联的对象只能生存到下一次垃圾收集发生之前。当垃圾收集器工作时,无论当前内存是否足够,都会回收掉只被弱引用关联的对象。在JDK 1.2之后,提供了WeakReference类来实现弱引用。

  • 虚引用也称为幽灵引用或者幻影引用,它是最弱的一种引用关系。一个对象是否有虚引用的存在,完全不会对其生存时间构成影响,也无法通过虚引用来取得一个对象实例。为一个对象设置虚引用关联的唯一目的就是希望能在这个对象被收集器回收时收到一个系统通知。在JDK 1.2之后,提供了PhantomReference类来实现虚引用。

  是否死亡


在根搜索算法中,在GCRoots没有可以到达的引用链之后,就一定会“死亡”吗?其实也不一定,要真正宣告一个对象死亡,至少要经历两次标记过程:如果对象在进行根搜索后发现没有与GCRoots相连接的引用链,那它将会被第一次标记并且进行一次筛选,筛选的条件是此对象是否有必要执行finalize()方法。当对象没有覆盖finalize()方法,或者finalize()方法已经被虚拟机调用过,虚拟机将这两种情况都视为“没有必要执行”。

当这个对象需要执行finalize()方法时,这个对象会被放置在一个名为F-Queue的队列中,并稍后由一条虚拟机自动建立的、低优先级的Finalizer线程去执行。这里的“执行”是虚拟机会触发这个方法,但并不一定会等待它运行结束。因为如果对象在finalize()方法中死循环或者超长时间执行,可能导致F-Queue队列中的其他对象永久处于等待状态,甚至可能导致内存回收系统奔溃。

finalize()方法是对象可以存活的最后一次机会,在这里可以将自己和引用链上的任何一个对象建立关联即可,否则就会进入到垃圾回收的系统中。但finalize()依旧是一种充满不确定性的方法,在诞生之初亦是为了C/C++程序员的更容易接受的一种妥协,推荐目前的try-finally方法处理更加优雅,也更安全可靠。

接着我们一起来看看虚拟机中对已经死亡的对象都有哪些垃圾回收是算法。

  标记-清除算法


标记-清除算法(Mark-Sweep)可以说应该是最基础的收集算法了。从字面意思很好理解,算法的过程分为标记过程和清楚过程。首先标记出所有需要回收的对象,在标记完了之后,对标记对象进行统一的回收工作。哪些对象需要标记,哪些对象不需要标记,这个再上一篇文章中进行了详细的介绍,可以回顾再了解下。

这个算法的缺点也非常明显,内存中的被标记的数据不一定都是连续,因此标记清楚之后,内存中会产生大量的内存碎片,碎片的存在也会导致在后续分配较大对象时候找不到足够的连续空间,导致内存不足。还有一个问题,便是标记和清楚的效率都不高。

但之所以说这是最基础的收集算法,是因为后续是算法基本上都是由此改进得来的。


  复制算法


为了解决效率问题,诞生了一种叫复制(Copying)的算法。该算法将可以用的内存空间划分为两大块,每次只使用其中的一块。当这块内存使用完了之后,就将还存活的对象复制到另一块空间中去。这样就不需要考虑内存碎片的问题,只需要移动堆顶指针,按顺序分配内存即可,简单高效。同样缺点也很明显,这样做了之后很明显,我们只能使用内存中的一半内存。代价还是比较高。

那么目前的虚拟机新生代中,就采用了这种回收算法。新生代的空间相对较小,内存空间由Eden,和两块Survivor空间组成,分配比例为8:1:1,也就是最多只有10%的空间是处于空闲的。当进行回收时,将新生代的Eden和其中一块的Survivor中的还存活的对象一次性拷贝到另一块Survivor的空间上,然后清理掉Eden和刚才用过的Survivor的空间。如果当Survivor的无法存放时候,就会进入老年代存放。


  标记-整理算法


复制算法在对象存活较高的时候,就会执行较多的复制操作,从而降低整体的回收效率,还有存在50%的空间浪费。基于这种情况,有人对标记-清楚算法进行改进,从而衍生出标记-整理(Mark-Compact)算法。

这种算法的标记过程和”标记-清楚“算法一致,不同的是标记完成之后,让所有存活的对象都移动到内存的一端,然后清理掉边界外面的内存。

  分代收集算法


当前商业虚拟机的垃圾收集都采用“分代收集”(Generational Collection)算法,这种算法并没有什么新的思想,只是根据对象的存活周期的不同将内存划分为几块。一般是把Java堆分为新生代和老年代,这样就可以根据各个年代的特点采用最适当的收集算法。在新生代中,每次垃圾收集时都发现有大批对象死去,只有少量存活,那就选用复制算法,只需要付出少量存活对象的复制成本就可以完成收集。而老年代中因为对象存活率高、没有额外空间对它进行分配担保,就必须使用“标记-清理”或“标记-整理”算法来进行回收。

哪些垃圾回收是算法?


  垃圾收集器


收集算法是用以支撑内存回收的理论,在虚拟机中对应的具体实现就是垃圾收集器。不同的厂商和开发者,可以依据自己的应用特点来实现对应的收集器,因此不同版本之间的收集器可能存在较大的差别。

以下收集器内容摘录自参考书籍《深入理解Java虚拟机》


  Serial垃圾收集器


Serial是最基本、历史最悠久的垃圾收集器,使用复制算法,曾经是JDK1.3.1之前新生代唯一的垃圾收集器。

Serial是一个单线程的收集器,它不仅仅只会使用一个CPU或一条线程去完成垃圾收集工作,并且在进行垃圾收集的同时,必须暂停其他所有的工作线程,直到垃圾收集结束。

Serial垃圾收集器虽然在收集垃圾过程中需要暂停所有其他的工作线程,但是它简单高效,对于限定单个CPU环境来说,没有线程交互的开销,可以获得最高的单线程垃圾收集效率,因此Serial垃圾收集器依然是java虚拟机运行在Client模式下默认的新生代垃圾收集器。

  ParNew垃圾收集器


ParNew垃圾收集器其实是Serial收集器的多线程版本,也使用复制算法,除了使用多线程进行垃圾收集之外,其余的行为和Serial收集器完全一样,ParNew垃圾收集器在垃圾收集过程中同样也要暂停所有其他的工作线程。

ParNew收集器默认开启和CPU数目相同的线程数,可以通过-XX:ParallelGCThreads参数来限制垃圾收集器的线程数。

ParNew虽然是除了多线程外和Serial收集器几乎完全一样,但是ParNew垃圾收集器是很多java虚拟机运行在Server模式下新生代的默认垃圾收集器。

  Parallel Scavenge收集器


Parallel Scavenge收集器也是一个新生代垃圾收集器,同样使用复制算法,也是一个多线程的垃圾收集器,它重点关注的是程序达到一个可控制的吞吐量(Thoughput,CPU用于运行用户代码的时间/CPU总消耗时间,即吞吐量=运行用户代码时间/(运行用户代码时间+垃圾收集时间)),高吞吐量可以最高效率地利用CPU时间,尽快地完成程序的运算任务,主要适用于在后台运算而不需要太多交互的任务。

Parallel Scavenge收集器提供了两个参数用于精准控制吞吐量:

  • XX:MaxGCPauseMillis:控制最大垃圾收集停顿时间,是一个大于0的毫秒数。

  • XX:GCTimeRation:直接设置吞吐量大小,是一个大于0小于100的整数,也就是程序运行时间占总时间的比率,默认值是99,即垃圾收集运行最大1%(1/(1+99))的垃圾收集时间。

Parallel Scavenge是吞吐量优先的垃圾收集器,它还提供一个参数:-XX:+UseAdaptiveSizePolicy,这是个开关参数,打开之后就不需要手动指定新生代大小(-Xmn)、Eden与Survivor区的比例(-XX:SurvivorRation)、新生代晋升年老代对象年龄(-XX:PretenureSizeThreshold)等细节参数,虚拟机会根据当前系统运行情况收集性能监控信息,动态调整这些参数以达到最大吞吐量,这种方式称为GC自适应调节策略,自适应调节策略也是ParallelScavenge收集器与ParNew收集器的一个重要区别。

  Serial Old收集器


Serial Old是Serial垃圾收集器年老代版本,它同样是个单线程的收集器,使用标记-整理算法,这个收集器也主要是运行在Client默认的java虚拟机默认的年老代垃圾收集器。

在Server模式下,主要有两个用途:

  • 在JDK1.5之前版本中与新生代的Parallel Scavenge收集器搭配使用。

  • 作为年老代中使用CMS收集器的后备垃圾收集方案。


  Parallel Old收集器


Parallel Old收集器是Parallel Scavenge的年老代版本,使用多线程的标记-整理算法,在JDK1.6才开始提供。

在JDK1.6之前,新生代使用ParallelScavenge收集器只能搭配年老代的Serial Old收集器,只能保证新生代的吞吐量优先,无法保证整体的吞吐量,Parallel Old正是为了在年老代同样提供吞吐量优先的垃圾收集器,如果系统对吞吐量要求比较高,可以优先考虑新生代Parallel Scavenge和年老代Parallel Old收集器的搭配策略。

  CMS收集器


Concurrent mark sweep(CMS)收集器是一种年老代垃圾收集器,其最主要目标是获取最短垃圾回收停顿时间,和其他年老代使用标记-整理算法不同,它使用多线程的标记-清除算法。

结语

小编也是很有感触,如果一直都是在中小公司,没有接触过大型的互联网架构设计的话,只靠自己看书去提升可能一辈子都很难达到高级架构师的技术和认知高度。向厉害的人去学习是最有效减少时间摸索、精力浪费的方式。

我们选择的这个行业就一直要持续的学习,又很吃青春饭。

虽然大家可能经常见到说程序员年薪几十万,但这样的人毕竟不是大部份,要么是有名校光环,要么是在阿里华为这样的大企业。年龄一大,更有可能被裁。

送给每一位想学习Java小伙伴,用来提升自己。

在这里插入图片描述

本文到这里就结束了,喜欢的朋友可以帮忙点赞和评论一下,感谢支持!

清除算法。

结语

小编也是很有感触,如果一直都是在中小公司,没有接触过大型的互联网架构设计的话,只靠自己看书去提升可能一辈子都很难达到高级架构师的技术和认知高度。向厉害的人去学习是最有效减少时间摸索、精力浪费的方式。

我们选择的这个行业就一直要持续的学习,又很吃青春饭。

虽然大家可能经常见到说程序员年薪几十万,但这样的人毕竟不是大部份,要么是有名校光环,要么是在阿里华为这样的大企业。年龄一大,更有可能被裁。

送给每一位想学习Java小伙伴,用来提升自己。

[外链图片转存中…(img-ftFTsuF5-1714390465547)]

本文到这里就结束了,喜欢的朋友可以帮忙点赞和评论一下,感谢支持!

本文已被CODING开源项目:【一线大厂Java面试题解析+核心总结学习笔记+最新讲解视频+实战项目源码】收录

  • 26
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值