面试难点之JVM内存区域

最新推荐文章于 2022-02-11 13:13:00 发布

qq_40364702

最新推荐文章于 2022-02-11 13:13:00 发布

阅读量195

点赞数

分类专栏：深入理解JVM 文章标签： JVM 堆栈方法区常量池

本文链接：https://blog.csdn.net/qq_40364702/article/details/102372125

版权

深入理解JVM 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

前言

前几天面OPPO被问到JVM问题，只能答出一二，遂凉。
于是痛定思痛，决定深入JVM，毕竟这是成为Java高级程序员乃至架构师的一个点。老实说JVM很琐碎，常常不知其所语，但还得耐住性子慢慢看，不然0offer。

运行时的JVM

JVM是与字节码文件打交道的：JVM读取字节码指令，然后在JVM所管理的内存存取数据。

JVM管理的内存包括以下几个运行时数据区域。如图
在这里插入图片描述

说白了，这几种数据区域就是虚拟机根据各自功能划分的内存块。就像不同居民楼小区各有各的名字一样。

程序计数器

程序计数器是一块较小的内存，记录的是当前线程正在执行的字节码的行号。

为什么会用到这种类似行号指示器的玩意呢？

因为像分支、循环、跳转、异常处理、线程恢复等功能都需要依赖这个计数器来实现。并且为了线程切换后能恢复到正确的执行位置，每条线程都需要有一个独立的程序计数器，我们称这类内存区域为“线程私有”的内存（后面会介绍同为此类型的其他内存区域）

Java虚拟机栈

与程序计数器一样，JVM栈也是线程私有的。

虚拟机栈是干嘛的呢？
我们所说的堆栈中的栈一般就是JVM栈，描述的是Java方法执行的内存模型：每个方法在执行的同时都会创建一个栈帧用于存储局部变量表、操作数栈、动态链接、方法出口等信息。方法调用到完成的过程，就对应着栈帧这种数据结构在JVM栈从入栈到出栈。

StackOverflowError（栈溢出）：当前线程请求的栈深度大于虚拟机所允许的深度，且虚拟机栈不能动态扩展。

OutOfMemoryError（内存溢出）：在发生栈溢出的情况下，虚拟机栈动态扩展无法申请到足够的内存。

栈溢出的延续会导致内存溢出；

本地方法栈

与虚拟机栈作用十分相似，虚拟机栈是JVM执行字节码中的方法时起作用，本地方法栈是JVM使用Native方法时起作用。本地方法栈也会抛出栈溢出和内存溢出。

Java堆

Java堆是被所有线程共享的一块内存区域，此内存区域唯一目的就是存放对象实例，几乎所有的对象实例都分配在堆上。

Java堆是垃圾收集管理的主要区域（gc方面后面再写），堆既可以是固定大小的，也可以是可扩展的，当前主流的JVM是可扩展的（通过-Xmx和-Xms控制）。堆也会抛出内存溢出。

方法区

与堆一样，是各个线程共享的内存区域，区别是它用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。别名叫非堆。

 运行时常量池？
 字节码文件除了字段、方法、接口等描述信息以外，
 还有存放编译后生成的各种字面量和符号引用的常量池。
                                                                                            
 而常量池在类加载后进入方法区的运行时常量池中存放。

运行时常量池是方法区的一部分，方法区也可以抛出内存溢出。

直接内存

直接内存不是JVM内的内存区域，是由Native函数库直接分配在堆外。但有一个存储在Java堆中的DirectByteBuffer对象作为这块直接内存的引用来进行操作。

虽然本机直接内存不受到Java堆大小的限制，但肯定受到本机总内存的限制。
调虚拟机参数如-Xmx等参数信息时，大家往往会忽略直接内存，使得各个内存区域总和大于本机内存和物理内存限制，从而导致内存溢出。

揭秘HotSpot虚拟机

在这里插入图片描述

类加载检查：虚拟机遇到一条new指令时，首先将去检查这个指令的参数是否能在常量池中定位到一个类的符号引用（比如 B b=new B();new A(b)），并且检查这个符号引用代表的类是否已被加载、解析和初始化过（必须先执行类加载过程）
接下来分配内存（一般都是堆内存），此时把一块大小已确定的内存从堆中划分出。如果Java堆是绝对规整的，分配方式为“指针碰撞”，否则分配方式为“空闲列表”；Java堆是否规则取决于gc回收内存时是否带有压缩管理功能 内存分配也会出现并发问题
在创建对象的时候有一个很重要的问题，就是线程安全，因为在实际开发过程中，创建对象是很频繁的事情，作为虚拟机来说，必须要保证线程是安全的，通常来讲，虚拟机采用两种方式来保证线程安全：

CAS+失败重试： CAS 是乐观锁的一种实现方式。所谓乐观锁就是，每次不加锁而是假设没有冲突而去完成某项操作，如果因为冲突失败就重试，直到成功为止。虚拟机采用 CAS 配上失败重试的方式保证更新操作的原子性。

TLAB： 为每一个线程预先在 Eden 区分配一块儿内存，JVM 在给线程中的对象分配内存时，首先在 TLAB 分配，当对象大于 TLAB 中的剩余内存或 TLAB 的内存已用尽时，再采用上述的 CAS 进行内存分配
初始化零值：内存分配完成后，虚拟机需要将分配到的内存空间都初始化为零值（不包括对象头），这一步操作保证了对象的实例字段在Java代码中可以不赋初始值就直接使用，程序能访问到这些字段的数据类型所对应的零值。
设置对象头：初始话零值完成之后，虚拟机要对对象进行必要的设置，例如这个对象是那个类的实例、如何才能找到类的元数据信息、对象的哈希码、对象的GC分代年龄等信息。**这些信息存放在对象头中。**另外，根据虚拟机当前运行状态的不同，如是否启用偏向锁等，对象头会有不同的设置方式。
执行init方法：在上面工作都完成之后，从虚拟机的视角来看，一个新的对象已经产生了，但从Java程序的视角来看，对象创建才刚开始，init方法还没有执行，所有的字段都还为零。所以一般来说，执行new指令之后会接着执行init方法，把对象按照程序员的意愿进行初始化，这样一个真正可用的对象才算完全产生出来。

对象的内存布局

一个对象实例在JVM中的布局可以分为3块区域：对象头、实例数据和对齐填充。

Hotspot虚拟机（最普遍）的对象头包括两部分信息，第一部分用于存储对象自身的自身运行时数据（哈希码、GC分代年龄、锁状态标志等等），另一部分是类型指针，即对象指向它的类元数据的指针，虚拟机通过这个指针来确定这个对象是那个类的实例。

实例数据部分是对象真正存储的有效信息，也是在程序中所定义的各种类型的字段内容。

**对齐填充部分不是必然存在的，也没有什么特别的含义，仅仅起占位作用。**因为Hotspot虚拟机的自动内存管理系统要求对象起始地址必须是8字节的整数倍，换句话说就是对象的大小必须是8字节的整数倍。而对象头部分正好是8字节的倍数（1倍或2倍），因此当对象实例数据部分还没有对齐时，就需要通过对齐填充来补全。

对象的访问定位

new一个对象就是为了使用对象，我们的Java程序通过栈上的reference数据（变量名）来操作堆上的具体对象。对象的访问方式由虚拟机实现而定，目前主流的访问方式有使用句柄和直接指针两种：

句柄：如果使用句柄的话，那么Java堆中将会划出一块内存来作为句柄池，reference（变量名）中存储的就是对象的句柄地址，而句柄中包含了对象实例数据与类型数据各自的具体地址信息；
直接指针：如果使用直接指针访问，那么Java堆对象的布局中就必须考虑如何放置访问类型数控的相关信息，而reference（变量名）中存储的直接就是对象的地址。
这两种对象访问方式各有优势。使用句柄来访问的最大好处是 reference 中存储的是稳定的句柄地址，在对象被移动时只会改变句柄中的实例数据指针，而 reference 本身不需要修改。使用直接指针访问方式最大的好处就是速度快，它节省了一次指针定位的时间开销。

String类和常量池

String 对象的两种创建方式：

String str1 = "abcd";//先检查字符串常量池中有没有"abcd"，如果字符串常量池中没有，则创建一个，然后 str1 指向字符串常量池中的对象，如果有，则直接将 str1 指向"abcd""；
String str2 = new String("abcd");//堆中创建一个新的对象
String str3 = new String("abcd");//堆中创建一个新的对象
System.out.println(str1==str2);//false
System.out.println(str2==str3);//false

这两种不同的创建方法是有差别的。

第一种方式是在常量池中拿对象；
第二种方式是直接在堆内存空间创建一个新的对象。

记住一点：只要使用 new 方法，便需要创建新的对象。
在这里插入图片描述
String 类型的常量池比较特殊。它的主要使用方法有两种：

直接使用双引号声明出来的 String 对象会直接存储在常量池中。
如果不是用双引号声明的 String 对象，可以使用 String 提供的 intern 方法。String.intern() 是一个 Native 方法，它的作用是：如果运行时常量池中已经包含一个等于此 String 对象内容的字符串，则返回常量池中该字符串的引用；如果没有，JDK1.7之前（不包含1.7）的处理方式是在常量池中创建与此 String 内容相同的字符串，并返回常量池中创建的字符串的引用，JDK1.7以及之后的处理方式是在常量池中记录此字符串的引用，并返回该引用。

        String s1 = new String("计算机");
          String s2 = s1.intern();
          String s3 = "计算机";
          System.out.println(s2);//计算机
          System.out.println(s1 == s2);//false，因为一个是堆内存中的 String 对象一个是常量池中的 String 对象，
          System.out.println(s3 == s2);//true，因为两个都是常量池中的 String 对象

字符串拼接：

          String str1 = "str";
          String str2 = "ing";

          String str3 = "str" + "ing";//常量池中的对象
          String str4 = str1 + str2; //在堆上创建的新的对象      
          String str5 = "string";//常量池中的对象
          System.out.println(str3 == str4);//false
          System.out.println(str3 == str5);//true
          System.out.println(str4 == str5);//false

new一个字符串会创建几个字符串对象？
将创建 1 或 2 个字符串。如果常量池中已存在字符串常量“abc”，则只会在堆空间创建一个字符串常量“abc”。如果常量池中没有字符串常量“abc”，那么它将首先在常量池中创建，然后在堆空间中创建，因此将创建总共 2 个字符串对象。

String s1 = new String("abc");// 堆内存的地址值
        String s2 = "abc";
        System.out.println(s1 == s2);// 输出 false,因为一个是堆内存，一个是常量池的内存，故两者是不同的。
        System.out.println(s1.equals(s2));// 输出 true

8种基本类型的包装类和常量池

Java 基本类型的包装类的大部分都实现了常量池技术，即 Byte,Short,Integer,Long,Character,Boolean；这 6 种包装类默认创建了数值[-128，127] 的相应类型的缓存数据，但是超出此范围仍然会去创建新的对象。为啥把缓存设置为[-128，127]区间？（参见issue/461）性能和资源之间的权衡。
两种浮点数类型的包装类 Float,Double 并没有实现常量池技术。

        Integer i1 = 33;
        Integer i2 = 33;
        System.out.println(i1 == i2);// 输出 true
        Integer i11 = 333;
        Integer i22 = 333;
        System.out.println(i11 == i22);// 输出 false
        Double i3 = 1.2;
        Double i4 = 1.2;
        System.out.println(i3 == i4);// 输出 false

Integer缓存源代码（上述其他五种基本包装类同理）：

/**
*此方法将始终缓存-128 到 127（包括端点）范围内的值，并可以缓存此范围之外的其他值。
*/
    public static Integer valueOf(int i) {
        if (i >= IntegerCache.low && i <= IntegerCache.high)
            return IntegerCache.cache[i + (-IntegerCache.low)];
        return new Integer(i);
    }

应用场景：

Integer i1=40；Java 在编译的时候会直接将代码封装成 Integer i1=Integer.valueOf(40);，从而使用常量池中的对象。
Integer i1 = new Integer(40);这种情况下会创建新的对象。

  Integer i1 = 40;
  Integer i2 = new Integer(40);
  System.out.println(i1==i2);//输出 false

Integer 比较更丰富的一个例子:

 Integer i1 = 40;
  Integer i2 = 40;
  Integer i3 = 0;
  Integer i4 = new Integer(40);
  Integer i5 = new Integer(40);
  Integer i6 = new Integer(0);

  System.out.println("i1=i2   " + (i1 == i2));
  System.out.println("i1=i2+i3   " + (i1 == i2 + i3));
  System.out.println("i1=i4   " + (i1 == i4));
  System.out.println("i4=i5   " + (i4 == i5));
  System.out.println("i4=i5+i6   " + (i4 == i5 + i6));   
  System.out.println("40=i5+i6   " + (40 == i5 + i6));

结果：i1=i2 true i1=i2+i3 true i1=i4 false i4=i5 false i4=i5+i6 true 40=i5+i6 true

语句 i4 == i5 + i6，因为+这个操作符不适用于 Integer 对象，首先 i5 和 i6 进行自动拆箱操作，进行数值相加，即 i4 == 40。然后 Integer 对象无法与数值进行直接比较，所以 i4 自动拆箱转为 int 值 40，最终这条语句转为 40 == 40 进行数值比较。

参考

qq_40364702

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
面试难点之JVM内存区域

前言前几天面OPPO被问到JVM问题，只能答出一二，遂凉。于是痛定思痛，决定深入JVM，毕竟这是成为Java高级程序员乃至架构师的一个点。运行时的JVMJVM是与字节码文件打交道的：JVM读取字节码指令，然后在JVM所管理的内存存取数据。JVM管理的内存包括以下几个运行时数据区域。如图说白了，这几种数据区域就是虚拟机根据各自功能划分的内存块。就像不同居民楼小区各有各的名字一样。...
复制链接

扫一扫

专栏目录