1. JVM的垃圾回收
1.1. 垃圾回收算法
- 标记清除算法
最基础的收集算法是“标记-清除”(Mark-Sweep)算法,此方法分为两个阶段:标记、清除。 标记要清除的对象,统一清除; 不足有两个: 一个是效率问题,标记和清除两个过程的效率都不高; 另一个是空间问题,标记清除之后会产生大量不连续的内存碎片,空间碎片太多可能会导致以后在程序运行过程中需要分配较大对象时,无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。
因为经过标记清除之后,会有大量的内存碎片,所以边对空间问题有了一个修正,标记整理算法:
第一步和第二步和标记清除算法一样,只不过为了产生更多的连续的可用空间,讲对象整理成连续的。
这种算法因为运行的效率不高的原因,一般都用在对老年代或者永久代的空间进行垃圾整理。
- 复制算法
复制算法:它将可用内存按容量划分为大小相等的两块,每次只使用其中的一块。当这一块的内存用完了,就将还存活着的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。 优点:无内存碎片,只要移动堆顶指针,按顺序分配内存即可,实现简单,运行高效。缺点:实际可用内存缩小为了原来的一半。
需要知道的是,现代商业虚拟都采用这个复制算法来回收新生代中的对象。
新生代垃圾回收的过程:
1、将内存分为一块较大的Eden空间和两块较小的Survivor空间;
2、每次使用Eden和其中一块Survivor。
3、当回收时,将Eden和Survivor中还存活着的对象一次性地复制到另外一块Survivor空间上,并清理掉Eden和刚才用过的Survivor空间。
HotSpot虚拟机默认Eden和Survivor的大小比例是8:1:1;浪费10%。
新生代垃圾回收过程示意图:
1.2. 三种gc方式
-
Minor GC
就是新生代的垃圾回收过程
-
Major GC
老年代或者永久代执行的gc,称之为Major GC
-
Full GC
Minor GC + Major GC
1.3. GC内存分配策略
对象在Eden分配:大多数情况下,对象在新生代Eden区中分配。当Eden区没有足够空间进行分配时,虚拟机将发起一次Minor GC,此时对象会进入survivor区,当对象满足一些条件后会进入老年代。
对象进入老年代有三种策略:
-
长期存活的对象直接进入老年代
虚拟机给每个对象定义了一个对象年龄(Age)计数器。如果对象在Eden出生并经过第一次Minor GC后仍然存活,并且能被Survivor容纳的话,将被移动到Survivor空间中,并且对象年龄设为1。对象在Survivor区中每“熬过”一次Minor GC,年龄就增加1岁,当它的年龄增加到一定程度(默认为15岁),就将会被晋升到老年代中。对象晋升老年代的年龄阈值,可以通过参数-XX:MaxTenuringThreshold设置。
-
在survivor中相同年龄的对象总体积超过survivor一半区域是,大于等于该年龄的对象直接晋升到老年代,无须等到MaxTenuringThreshold中要求的年龄。
-
大对象直接在老年代中被创建
虚拟机提供了一个-XX:PretenureSizeThreshold参数,令大于这个设置值的对象直接在老年代分配。这样做的目的是避免在Eden区及两个Survivor区之间发生大量的内存复制。
1.4. GC空间担保问题
1、在发生Minor GC之前,虚拟机会先检查老年代最大可用的连续空间是否大于新生代的所有对象总空间,如果这个条件成立,那么Minor GC可以确保是安全的。
2、如果不成立,则虚拟机会查看-XX:HandlePromotionFailure设置值是否允许担保失败。
3、如果允许,那么会继续检查老年代最大可用的连续空间是否大于历次晋升到老年代对象的平均大小,如果大于,将尝试着进行一次Minor GC,尽管这次Minor GC是有风险的;如果小于,或者HandlePromotionFailure设置不允许冒险,那这时也要改为进行一次Full GC。
2. 常见的垃圾收集器
垃圾收集器就是内存回收的具体实现。 java虚拟机规范没有对收集器应该如何实现有任何规定,因为不同版本、不同厂商的虚拟机提供的垃圾收集器都可能会有很大的差异。
2.1. gc过程中的并行和并发
并行(Parallel):指多条垃圾收集线程并行工作,但是此时:用户线程仍然处于线程等待状态。
并发(Concurrent):指用户线程和垃圾收集线程同时执行(但不一定是并行的,可能会交替执行),用户程序在继续运行,而垃圾收集程序运行于另一个cpu上。
2.2. 常见的垃圾收集器
2.2.1. Serial
Serial收集器是最基础、历史最悠久的适合新生代的收集器。
特点:单线程、stop-the-world 、复制算法
缺点:影响用户响应时间
优点:回收时简单高效、对于限定单个cpu环境下,serial收集器由于没有线程交互的开销,专心做垃圾收集,可以获得最高的单线程收集效率。 所以:serial 收集器 对于运行在client模式下的虚拟机来说,是一个很好的选择。 serialOld收集器是Serial的老年代收集器,采用“标记-整理”
运行参数:-XX:+UseSerialGC
2.2.2. ParNew
ParNew收集器其实是Serial的多线程版本,除了他是使用多条线程来进行垃圾回收之外和Serial是完全一样的。是新生代收集器
特点:多线程、stop-the-world
缺点:单个cpu下,运行效果甚至没Serial好。
优点:回收时简单高效、对于限定多个cpu环境下,效果比serial好。 所以:parnew收集器是运行在server模式下的首选收集器。运行参数:--XX:+UseParNewGC
2.2.3. parallel scanvenge
Parallel Scanvenge收集器是一个新生代收集器,采用复制算法。
特点:收集新生代,复制算法,多线程,高吞吐、自适应
1、与其它的收集器侧重垃圾回收时用户的停顿时间不同,它主要侧重与吞吐量,吞吐量=运行用户代码时间/(运行用户代码时间+垃圾收集时间)。 停顿时间越短就越适合需要与用户交互的程序,高吞吐量则是可以高效率地利用cpu时间尽快完成任务。
2、他有一个自适应开关(-XX:+UseAdaptiveSizePolicy):打开后,用户只需要把基本的内存数据(堆最大,初始量)设置好,然后设置更关注最大停顿时间或者更关注吞吐量,收集器会把细节参数自动调节。 Parallel Old 老年代收集器,采用标记-整理算法。
运行时设置的:-XX:+UseParallelGC
2.2.4. ConcMarkSweep/CMS
CMS(concurrent mark sweep)收集器是一个以获取最短回收停顿时间为目标的老年代收集器。
特点:并发收集、低停顿。
基于 标记-清除算法实现,但是整个过程比较复杂一些。过程分为4步:
1、初始标记:仅仅标记GCRoot能直接关联到的对象。速度很快,“stop the world”
2、并发标记:GCRoot Tracing。耗时长和用户线程同步。
3、重新标记:修正并发标记时,由于用户程序运行导致的标记变动。“stop the world”停顿稍长一些。
4、并发清除:耗时长,和用户线程同步。 缺点:吞吐量会变低、浮动垃圾无法处理、标记-清除的碎片(设置参数是 fullgc前开启碎片整理功能,gc停顿时间延长)。
可以兼容的新生代收集器:ParNew和Serial
运行时设置:-XX:+UseConcMarkSweepGC
2.2.5. G1
G1(Garbage-First)收集器是当今收集器领域最前沿成果之一。2004年sun发表第一篇G1论文,10年后才开发出G1的商用版本。 hotspot开发团队赋予它的使命:未来替调CMS收集器。
特点:
1、并行与并发:利用多cpu缩短stop-the-world的时间,使用并发方式解决其它收集器需要停顿的gc动作。
2、分代收集:新老代收集区分对待。
3、空间整合:G1从整理看是基于标记-整理,但是局部看是基于复制算法实现的,不会产生碎片。
4、可预测的停顿:能够让使用者指定在M毫秒的时间片段上,消耗在垃圾回收的时间不得超过N毫秒。 过程:初始标记、并发标记、最终标记、筛选回放。前三个和CMS一致,筛选回放是根据用户设置的停顿目标来选择回收价值最高的进行回收。
-XX:+UseG1GC
G1在jdk1.9之后才能够使用
3. 常见的jvm分析工具
3.1. CLI(Command Line interface)
3.1.1. jps(java process status)
jps:Java Virtual Machine Process Status Tool
http://docs.oracle.com/javase/1.5.0/docs/tooldocs/share/jps.html
jps [ options ] [ hostid ]
-q 只显示pid,不显示class名称,jar文件名和传递给main 方法的参数
-m -m 输出传递给main 方法的参数,在嵌入式jvm上可能是null
-l 输出应用程序main class的完整package名 或者 应用程序的jar文件完整路径名
-v 输出传递给JVM的参数
jps host 查看host的jps情况(前提:host提供jstatd服务)
3.1.2. jmap
jmap [ option ] pid
pid 进程号(常用)
参数如下:
-heap:打印jvm heap的情况(垃圾收集器类型)
-histo:打印jvm heap的直方图。其输出信息包括类名,对象数量,对象占用大小。
-histo:live :同上,但是只打印存活对象的情况
-permstat:打印permanent generation heap(方法区)情况(在jdk1.8之后不存在方法区)
-finalizerinfo:打印正等候回收的对象信息
[bigdata@bigdata01 jvm]$ jmap -heap 8580
Attaching to process ID 8580, please wait...
Debugger attached successfully.
Server compiler detected.
JVM version is 25.112-b15using thread-local object allocation.
Parallel GC with 4 thread(s)
-Xms:500m -Xmx:1000m 500M <= 堆空间 <= 1000m
Heap Configuration:
MinHeapFreeRatio = 0 ---->堆最小的空闲比例,此时堆的空间大小是多少:也就是说堆空间被占满,显然就是1000m
MaxHeapFreeRatio = 100 ---->堆最大的空闲比例,此时堆的空间大小是多少? 也就是说堆空间使用最小内存,显然就是500m
MaxHeapSize = 1048576000 (1000.0MB) 堆的最大空间大小
NewSize = 21495808 (20.5MB) 新生代初始化空间大小
MaxNewSize = 349175808 (333.0MB) 新生代最大空间大小
OldSize = 43515904 (41.5MB) 老年代的初始化空间大小
NewRatio = 2 老年代和新生代的内存空间比例=2:1,加入调整为3-->-XX:NewRatio=3
SurvivorRatio = 8 Eden区和survivor空间比例:8:1:1
MetaspaceSize = 21807104 (20.796875MB) jdk1.8之后叫做元数据区,就是jdk1.8以前的PermSize, 初始化空间大小
CompressedClassSpaceSize = 1073741824 (1024.0MB) 压缩的类的空间大小
MaxMetaspaceSize = 17592186044415 MB 对应的最大空间大小
G1HeapRegionSize = 0 (0.0MB)Heap Usage:
PS Young Generation 新生代
Eden Space:
capacity = 73400320 (70.0MB) 容量
used = 11939112 (11.386024475097656MB) 已用大小
free = 61461208 (58.613975524902344MB) 空闲大小
16.26574925013951% used
From Space:
capacity = 4194304 (4.0MB)
used = 131072 (0.125MB)
free = 4063232 (3.875MB)
3.125% used
To Space:
capacity = 6815744 (6.5MB)
used = 0 (0.0MB)
free = 6815744 (6.5MB)
0.0% used
PS Old Generation 老年代
capacity = 76546048 (73.0MB)
used = 51528752 (49.14164733886719MB)
free = 25017296 (23.858352661132812MB)
67.31732512173588% used16790 interned Strings occupying 1695440 bytes.
4. 常见jvm调优参数总结
Java1.7的jvm参数查看一下官方网站。
http://docs.oracle.com/javase/7/docs/technotes/tools/windows/java.html
Java1.8
http://docs.oracle.com/javase/8/docs/technotes/tools/windows/java.html
Hotspotvm知识查看一下官方网站。
http://www.oracle.com/technetwork/java/javase/tech/index-jsp-136373.html
主要的参数是:堆的大小、栈的大小、新生代和老年代的比值、新生代中eden和s0、s1的比值。
--Xms:初始堆大小,默认是物理内存的1/64。默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时,JVM就会增大堆直到--Xmx的最大限制。例如:-Xms 20m。
--Xmx:最大堆大小。默认是物理内存的1/4 默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时,JVM会减少堆直到 ----Xms 的最小限制。
--XX:NewSize=n:设置年轻代大小(初始值)。
--XX:MaxNewSize:设置年轻代最大值。
--XX:NewRatio=n : 设置年轻代和年老代的比值。
--XX:SurvivorRatio=n : 年轻代中Eden区与两个Survivor区的比值。
--XX:PermSize(1.8之后改为MetaspaceSize) 设置持久代(perm gen)初始值,默认是物理内存的1/64。
--XX:MaxPermSize=n:(1.8之后改为MaxMetaspaceSize)设置最大持久代大小。
--Xss:每个线程的堆栈大小。