这里写目录标题
1.为什么要把Java堆分代?
为什么要把Java堆分代?不分代就不能正常工作了吗?经研究,不同对象的生命周期不同。70%-99%的对象是临时对象。
- 新生代:有Eden、两块大小相同的survivor(又称为from/to,s0/s1)构成,to总为空。
- 老年代:存放新生代中经历多次GC仍然存活的对象。
其实不分代完全可以,分代的唯一理由就是优化GC性能;
如果没有分代,那所有的对象都在一块,就如同把一个学校的人都关在一个教室。GC的时候要找到哪些对象没用,这样就会对堆的所有区域进行扫描,而很多对象都是朝生夕死的,如果分代的话,把新创建的对象放到某一地方,当GC的时候先把这块存储“朝生夕死”对象的区域进行回收,这样就会腾出很大的空间出来。
2.堆内存分配策略
2.1.对象晋升规则
- 对象在Eden出生并经过第一次Minor GC后仍然存活,并且能被Survivor容纳的话,将被移动到Survivor空间中,并将对象年龄设为1。
- 对象在Survivor区中每熬过一次MinorGC,年龄就增加1岁
- 当它的年龄增加到一定程度(默认为15岁,其实每个JVM、每个GC都有所不同)时,就会被晋升到老年代
- 对象晋升老年代的年龄阀值,可以通过选项**-XX:MaxTenuringThreshold**来设置
也就是说:普通对象的晋升路线是随着每一次minor GC后,年龄+1,当年龄达到15岁,再次发生GC,进入老年区
2.2.不同年龄段对象分配原则
1.新对象优先分配到Eden
一般普通对象会直接分配到Eden区;
2.大对象直接分配到老年代
- 开发中比较长的字符串或者数组,会直接存在老年代,由于老年代触发Major GC的次数比 Minor GC要更少,因此回收起来就会比较慢
- 应该避免程序中出现过多的大对象
/**
* 测试:大对象直接进入老年代
* -Xms60m -Xmx60m -XX:NewRatio=2 -XX:SurvivorRatio=8 -XX:+PrintGCDetails
*
* @author shkstart shkstart@126.com
* @create 2020 21:48
*/
public class YoungOldAreaTest {
public static void main(String[] args) {
byte[] buffer = new byte[1024 * 1024 * 20];//20m
}
}
分配60m的堆内存;新生代20m;Eden区 16m;s0 2m;s1 2m;
创建一个20m的byte数组,Eden区放不下,直接放进old区;
也就是说:对象进入老年代有两种途径,一种就是老老实实Minor GC,熬资历;要么就是有特长,Eden区放不下,直接进入老年代;
3.长期存活的对象分配到老年代
经过15次minor GC的对象在第16次会被分配到老年代;
4.动态对象年龄判断
如果Survivor区中相同年龄的所有对象大小的总和大于Survivor空间的一半,年龄大于或者等于该年龄的对象可以直接进入老年代,不用等到阈值年纪。
2.3 老年代担保机制
1、在发生Minor GC之前,虚拟机会检查老年代最大可用的连续空间是否大于新生代所有对象的总空间
- 如果大于,直接Minor GC,因为安全
- 如果小于,则虚拟机会查看 -XX:HandlePromotionFailure 设置值是否允担保失败。
- 如果HandlePromotionFailure=true,那么会继续检查老年代最大可用连续空间是否大于以往晋升到老年代的对象的平均大小
- 如果大于,则进行一次Minor GC,但是会有风险
- 如果小于,则进行一次Full GC。
- 如果HandlePromotionFailure=false,意味着不给担保,那么进行full GC
- 如果HandlePromotionFailure=true,那么会继续检查老年代最大可用连续空间是否大于以往晋升到老年代的对象的平均大小
JDK7之后的担保机制改变
-
JDK7及之后,HandlePromotionFailure 该参数就失效了,默认为true
-
JDK7及之后的规则变为只要老年代的连续空间大于新生代对象总大小或者历次晋升的平均大小就会进行Minor GC,否则将进行Full GC。
开启了老年代担保,-XX:HandlePromotionFailure
,在来一个新对象Eden区放不下了,触发Minor GC时,会走老年代担保机制判断是Minor GC还是Full GC,如果是Minor GC后,所有的对象都存活,因为Survivor比较小,所以就需要将Survivor无法容纳的对象,存放到老年代中。
public class GCTest {
public static void main(String[] args) {
byte[] allocation1, allocation2,allocation3,allocation4,allocation5;
allocation1 = new byte[32000*1024];
allocation2 = new byte[1000*1024];
allocation3 = new byte[1000*1024];
allocation4 = new byte[1000*1024];
allocation5 = new byte[1000*1024];
}
}
- 给 allocation2 分配内存的时候 eden 区内存几乎已经被分配完了,当 Eden 区没有足够空间进行分配时,虚拟机将发起一次 Minor GC;
- GC 后,虚拟机又发现 allocation1 无法存入 Survivor 空间,所以只好通过 分配担保机制:把新生代的对象提前转移到老年代中去,老年代上的空间足够存放 allocation1,所以不会出现 Full GC。执行 Minor GC 后,后面分配的对象如果能够存在 eden 区的话,还是会在 eden 区分配内存。
3.为对象分配内存:TLAB
3.1 TLAB是什么?
- TLAB: Thread Local Allocation Buffer 线程本地分配缓存
- JVM会为每个线程分配了一个线程私有缓存区域,该区域在Eden区域中 ; 当一个线程的TLAB存满时,可以使用公共区域(蓝色)的
- 所有OpenJDK衍生出来的JVM都提供了TLAB的设计
3.2 为什么有 TLAB?
- 堆区是线程共享区域,任何线程都可以访问到堆区中的共享数据
- 由于对象实例的创建在JVM中非常频繁,因此在并发环境下从堆区中划分内存空间是线程不安全的
- 为避免多个线程操作同一地址,需要使用加锁等机制,进而影响分配速度。
- 所以在多线程同时分配内存时,使用TLAB可以①避免一系列的非线程安全问题,同时②还能够提升内存分配的吞吐量,因此我们可以将这种内存分配方式称之为快速分配策略。
3.3 TLAB 分配过程
- 尽管不是所有的对象实例都能够在TLAB中成功分配内存,但JVM确实是将TLAB作为内存分配的首选。
- 在程序中,开发人员可以通过选项-XX:UseTLAB设置是否开启TLAB空间。
- 默认情况下,TLAB空间的内存非常小,仅占有整个Eden空间的1%,当然我们可以通过选项-XX:TLABWasteTargetPercent设置TLAB空间所占用Eden空间的百分比大小。
- 一旦对象在TLAB空间分配内存失败时,JVM就会尝试着通过使用加锁机制确保数据操作的原子性,从而直接在Eden空间中分配内存。
测试-XX:UseTLAB参数是否开启的情况:默认情况是开启的
/**
* 测试-XX:UseTLAB参数是否开启的情况:默认情况是开启的
*
* @author shkstart shkstart@126.com
* @create 2020 16:16
*/
public class TLABArgsTest {
public static void main(String[] args) {
System.out.println("我只是来打个酱油~");
try {
Thread.sleep(1000000);
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}
查看 UseTLAB 标志位的状态
>jps
>jinfo -flag UseTLAB 15420
4.堆是分配对象的唯一选择么?
在《深入理解Java虚拟机》中关于Java堆内存有这样一段描述:
- 随着JIT编译期的发展与逃逸分析技术逐渐成熟,栈上分配、标量替换优化技术将会导致一些微妙的变化,所有的对象都分配到堆上也渐渐变得不那么“绝对”了。
- 在Java虚拟机中,对象是在Java堆中分配内存的,这是一个普遍的常识。但是,有一种特殊情况,那就是如果经过逃逸分析(Escape Analysis)后发现,一个对象并没有逃逸出方法的话,那么就可能被优化成栈上分配。这样就无需在堆上分配内存,也无须进行垃圾回收了。这也是最常见的堆外存储技术。
- 此外,前面提到的基于OpenJDK深度定制的TaoBaoVM,其中创新的GCIH(GCinvisible heap)技术实现off-heap,将生命周期较长的Java对象从heap中移至heap外,并且GC不能管理GCIH内部的Java对象,以此达到降低GC的回收频率和提升GC的回收效率的目的。
4.1.逃逸分析技术(☆☆☆)
-
逃逸分析的作用:通过逃逸分析,Java Hotspot编译器能够分析出一个新的对象的引用的使用范围从而决定是否要将这个对象分配到堆上。没有发生逃逸的对象,则可以分配到栈上,随着方法执行的结束,栈空间就被移除
-
逃逸分析的描述:这是一种可以有效减少Java程序中同步负载和内存堆分配压力的跨函数全局数据流分析算法。
-
逃逸分析的评判标准:就是分析对象动态作用域(生命周期)
-
逃逸分析的前提:当一个对象在方法中被定义。
如果这个对象只在方法内部使用,则认为没有发生逃逸。如果它被外部方法所引用,则认为发生逃逸。例如作为调用参数传递到其他地方中。 -
逃逸分析的本质:如何快速的判断是否发生了逃逸分析,就看new的对象实体是否有可能在方法外被调用
-
逃逸分析的发生时间:在JIT编译期间
逃逸分析举例
- Demo1
public void my_method() {
V v = new V();
// use v
// ....
v = null;
}
new V(); 在堆空间中分配了一个V对象,但是该V对象的生命周期仅限于这个方法内。这就认为该对象没有发生逃逸,这样的话,该对象可以分配到栈上,随着方法执行结束,栈空间就被移除。
- Demo2
下面代码中的 StringBuffer sb 发生了逃逸,不能在栈上分配
public static StringBuffer createStringBuffer(String s1, String s2) {
StringBuffer sb = new StringBuffer();
sb.append(s1);
sb.append(s2);
return sb;
}
如果想要StringBuffer sb不发生逃逸,可以这样写
public static String createStringBuffer(String s1, String s2) {
StringBuffer sb = new StringBuffer();
sb.append(s1);
sb.append(s2);
return sb.toString();
}
第一个例子,StringBuffer对象在执行append()方法后,得到的仍然是StringBuffer对象,最后对象被返回了,很可能被别的方法调用,因此逃逸了,没有随着方法的结束而消亡。
第二个例子中,返回的不是StringBuffer对象,StringBuffer调用toString()后得到的是新的String对象,因此StringBuffer对象逃逸了。
4.2 如何判断对象是否会逃逸
最根本的判断依据就是方法体内New的对象会不会在外部被使用。
/**
* 逃逸分析
*/
public class EscapeAnalysis {
public EscapeAnalysis obj;
/*
对象作为返回值 被弹出方法,发生逃逸
如果obj是null,那么创建一个EscapeAnalysis()对象,然后弹出 发生逃逸。
如果不是null,那么就不会创建该对象。
*/
public EscapeAnalysis getInstance(){
return obj == null? new EscapeAnalysis() : obj;
}
/*
方法中创建的对象赋值给成员属性,发生逃逸
EscapeAnalysis对象赋值给了实例变量或者类变量,
这说明他的生命周期不随方法结束而结束,便发生了逃逸。
如果当前的obj引用声明为static的?仍然会发生逃逸。
*/
public void setObj(){
this.obj = new EscapeAnalysis();
}
/*
方法中引用的是成员变量
对象的作用域仅在当前方法中有效,没有发生逃逸
*/
public void useEscapeAnalysis(){
EscapeAnalysis e = new EscapeAnalysis();
}
/*
引用成员变量的值,发生逃逸
*/
public void useEscapeAnalysis1(){
EscapeAnalysis e = getInstance();
//getInstance().xxx()同样会发生逃逸
}
}
4.3 逃逸分析参数设置
- 在JDK 1.7版本之后,HotSpot中默认就已经开启了逃逸分析
- 如果使用了较早的版本,开发人员可以通过
-XX:DoEscapeAnalysis 显式开启逃逸分析
-XX:+PrintEscapeAnalysis查看逃逸分析的筛选结果
结论:开发中能使用局部变量的,就不要使用在方法外定义
4.4 根据逃逸分析进行代码优化
使用逃逸分析,编译器可以对代码进行以下几种优化方式:
- 栈上分配: 就是说一个方法的局部变量,其生命周期仅限于该方法内部,随着方法结束而消亡,此时可以不进行堆分配,而是像局部变量表一样在栈上分配。
- 同步省略: 如果一个对象被发现只能从一个线程被访问到,那么对于这个对象的操作可以不考虑同步。
- 分离对象或者标量替换。 有的对象可能不需要作为一个连续的内存结构存在也可以被访问到,那么对象的部分(或全部)可以不存储在内存,而是存储在CPU寄存器中。
1.栈上分配
- JIT编译器在编译期间根据逃逸分析的结果,发现如果一个对象并没有逃逸出方法的话,就可能被优化成栈上分配。分配完成之后,继续在调用栈内执行,最后线程结束,栈空间被回收,局部变量对象也被回收。这样就无须进行垃圾回收了
- 常见的发生逃逸的场景:给成员变量赋值、方法返回值、实例引用传递
/**
* 栈上分配测试
* -Xmx128m -Xms128m -XX:-DoEscapeAnalysis -XX:+PrintGCDetails
*/
public class StackAllocation {
public static void main(String[] args) {
long start = System.currentTimeMillis();
for (int i = 0; i < 10000000; i++) {
alloc();
}
// 查看执行时间
long end = System.currentTimeMillis();
System.out.println("花费的时间为: " + (end - start) + " ms");
// 为了方便查看堆内存中对象个数,线程sleep
try {
Thread.sleep(1000000);
} catch (InterruptedException e1) {
e1.printStackTrace();
}
}
private static void alloc() {
User user = new User();//未发生逃逸
}
static class User {
}
}
- 不开启逃逸分析:也就是说在堆中创建对象
1、JVM 参数设置
-Xmx128m -Xms128m -XX:-DoEscapeAnalysis -XX:+PrintGCDetails
2、日志打印:发生了 GC ,耗时 114ms - 开启逃逸分析
1、参数设置
-Xmx128m -Xms128m -XX:+DoEscapeAnalysis -XX:+PrintGCDetails
2、日志打印:并没有发生 GC ,耗时5ms 。 - 减小堆空间大小在测试一次:
不开启逃逸分析
开启逃逸分析:
可以看出开启逃逸分析,未逃逸对象只在栈上分配,随着方法结束而消失,不需要GC,不需要在堆空间分配内存,因此速度要快很多,而且JVM不会维护10000000个对象实例。
2.同步省略
- 线程同步的代价是相当高的,同步的后果是降低并发性和性能。
- 在动态编译同步块的时候,JIT编译器可以借助逃逸分析来判断同步块所使用的锁对象是否只能够被一个线程访问而没有被发布到其他线程。如果没有,那么JIT编译器在编译这个同步块的时候就会取消对这部分代码的同步。这样就能大大提高并发性和性能。这个取消同步的过程就叫同步省略,也叫锁消除。
public void f() {
Object hollis = new Object();
synchronized(hollis) {
System.out.println(hollis);
}
}
代码中对hollis这个对象加锁,但是hollis对象的生命周期只在f()方法中,并不会被其他线程所访问到,所以在JIT编译阶段就会被优化掉,优化成:
public void f() {
Object hellis = new Object();
System.out.println(hellis);
}
同步代码需要加锁,为不同线程的同步共享。但是要求所加的锁是同一个锁才有意义,上述同步代码块每次的锁对象hollos都是新new出来的,这并不符合加锁的同步效果。可以说是一个错误的代码。但能说明问题!
示例代码的字节码分析
字节码文件中并没有进行优化,可以看到加锁和释放锁的操作依然存在,同步省略操作是在解释运行时发生的
3.标量替换
- 标量:无法被分解的最小的数据。Java中原始数据类型就是标量。
- 聚合量:可以被分解的就是聚合量。Java中对象就是聚合量。
- 在JIT阶段,经过逃逸分析发现一个对象不能逃逸的话,经过JIT优化,就会把这个对象拆解成各个标量,这个过程就是标量替换。
如下所示:alloc()方法中,可以将Point对象拆解成两个int标量。
public static void main(String args[]) {
alloc();
}
private static void alloc() {
Point point = new Point(1,2);
System.out.println("point.x" + point.x + ";point.y" + point.y);
}
class Point {
private int x;
private int y;
}
以上代码,经过标量替换后,就会变成
private static void alloc() {
int x = 1;
int y = 2;
System.out.println("point.x = " + x + "; point.y=" + y);
}
- 可以看到,Point这个聚合量经过逃逸分析后,发现他并没有逃逸,就被替换成两个标量了。
- 那么标量替换有什么好处呢?就是可以大大减少堆内存的占用。因为一旦不需要创建对象了,那么就不再需要分配堆内存了。
- 标量替换为栈上分配提供了很好的基础。
标量替换参数设置
-
配置参数:-XX:+EliminateAllocations,开启标量替换(默认打开)。
-
代码示例
public class ScalarReplace {
public static class User {
public int id;//标量(无法再分解成更小的数据)
public String name;//聚合量(String还可以分解为char数组) }
public static void alloc() {
User u = new User();//未发生逃逸
u.id = 5;
u.name = "www.atguigu.com";
}
public static void main(String[] args) {
long start = System.currentTimeMillis();
for (int i = 0; i < 10000000; i++) {
alloc();
}
long end = System.currentTimeMillis();
System.out.println("花费的时间为: " + (end - start) + " ms");
}
}
(1)关闭标量替换测试
1、JVM 参数
-Xmx100m -Xms100m -XX:+DoEscapeAnalysis -XX:+PrintGC -XX:-EliminateAllocations
2、代码执行结果:
[GC (Allocation Failure) 25600K->736K(98304K), 0.0199386 secs]
[GC (Allocation Failure) 26336K->736K(98304K), 0.0404454 secs]
[GC (Allocation Failure) 26336K->768K(98304K), 0.0254357 secs]
[GC (Allocation Failure) 26368K->720K(98304K), 0.0008551 secs]
[GC (Allocation Failure) 26320K->720K(98304K), 0.0212983 secs]
[GC (Allocation Failure) 26320K->720K(101376K), 0.0398378 secs]
[GC (Allocation Failure) 32464K->684K(101376K), 0.0382330 secs]
[GC (Allocation Failure) 32428K->684K(101376K), 0.0155815 secs]
花费的时间为: 286 ms
(2)开启标量替换
1、JVM 参数
-Xmx100m -Xms100m -XX:+DoEscapeAnalysis -XX:+PrintGC -XX:+EliminateAllocations
2、日志:时间减少很多,且无GC
花费的时间为: 10 ms
可以测试对比一下,如果开启标量替换的性能提升,还是很巨大的。
4.逃逸分析总结
- 关于逃逸分析的论文在1999年就已经发表了,但直到JDK1.6才有实现,而且这项技术到如今也并不是十分成熟的。
- 其根本原因就是无法保证逃逸分析的性能消耗一定能高于他的消耗。虽然经过逃逸分析可以做标量替换、栈上分配、和锁消除。但是逃逸分析自身也是需要进行一系列复杂的分析的,这其实也是一个相对耗时的过程。
- 一个极端的例子,就是经过逃逸分析之后,发现没有一个对象是不逃逸的。那这个逃逸分析的过程就白白浪费掉了。
- 虽然这项技术并不十分成熟,但是它也是即时编译器优化技术中一个十分重要的手段。 注意到有一些观点,认为通过逃逸分析,JVM会在栈上分配那些不会逃逸的对象,这在理论上是可行的,但是取决于JVM设计者的选择。
- 据我所知,Oracle HotspotJVM中并未这么做,这一点在逃逸分析相关的文档里已经说明,所以可以明确所有的对象实例都是创建在堆上。
- 回归本篇的提问:堆是分配对象的唯一选择么?一开始我们是否定的态度,现在我们又去肯定这一观点。这岂不是自相矛盾。。正所谓否定之否定的观点,通过这篇文章,我们还是有进步的,至少分离对象或标量替换这一点还是存在的,优化了代码运行的效率,减少了堆空间的占用,体现了栈上分配的思想。
- 目前很多书籍还是基于JDK7以前的版本,JDK已经发生了很大变化,intern字符串的缓存和静态变量曾经都被分配在永久代上,而永久代已经被元数据区取代。但是,intern字符串缓存和静态变量并不是被转移到元数据区,而是直接在堆上分配,所以这一点同样符合前面一点的结论:对象实例都是分配在堆上。
4.4 小结
- 年轻代是对象的诞生、生长、消亡的区域,一个对象在这里产生、应用、最后被垃圾回收器收集、结束生命
- 老年代放置长生命周期对象,通常都是从Survivor区域筛选拷贝过来的Java对象。当然,也有特殊情况,我们知道普通的对象会被分配在TLAB上,如果对象较大,JVM会试图直接分配在Eden其他位置上;如果对象太大,完全无法在新生代找到足够长的连续空闲空间,JVM就会直接分配到老年代
- 当GC只发生在年轻代中,回收年轻对象的行为被称为MinorGC。当GC发生在老年代时则被称为MajorGC或者FullGC。一般的,MinorGC的发生频率要比MajorGC高很多,即老年代中垃圾回收发生的频率大大低于年轻代
- 逃逸分析只作用于服务器端JVM -server
- Oracle HotSpot JVM 没有应用栈上分配,而是用标量替换来提高性能,所以最终还是认为对象是分配在堆上的。