知识总结——JVM

​内存区域

Java虚拟机在执行Java程序的过程中把它管理的内存划分为若干个不同的数据区。

  • 程序计数器:当前线程所执行的字节码的行号指示器,字节码解释器工作时通过改变这个计数器的值来选取下一条需要执行的字节码指令。分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖它;多线程场景下,程序计数器用于记录本线程执行位置情况,方便下次切换回来继续执行。此区域是唯一一个不会出现OutOfMemoryError的区域,生命周期随线程

  • 虚拟机栈:生命周期跟线程一样,描述的是Java方法执行的内存模型,每个方法在执行的同时创建一个栈帧,用于存放局部变量表、操作数栈、动态链接、方法出口等信息。

  • 局部变量表:存放了编译期可知的基本数据类型、对象引用和returnAddress类型。它所需的内存大小在编译期完成分配,在方法的运行期不改变。注:线程请求的栈深度大于虚拟机所允许的深度,将抛出StackOverflowError;如果虚拟机栈可以动态扩展,扩展的时候申请不到足够内存则抛出OutOfMemoryError。

  • 本地方法栈:与虚拟机作用相似,但是它执行的是Native方法。

  • 堆:Java虚拟机管理内存最大的一块,线程共享,在虚拟机启动时创建,几乎所有的对象实例都在这里分配内存。它是垃圾收集器管理的主要区域,因此也叫做GC堆。从内存回收的角度来看,由于现在的收集器基于分代收集算法,所以堆还可以细分为新生代和老年代。Java堆可以是物理上不连续的内存空间,逻辑连续即可。如果在堆中没有内存完成实力分配,并且堆也无法扩展时,抛出OutOfMemoryError异常。

  • 方法区:线程共享。存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。因为GC分代收集扩展至方法区,所以一部分人称方法区为永久代。它还可以选择不实现垃圾收集,内存回收的主要目标是针对常量池的回收和对类型的卸载。当方法区无法满足内存分配需求时,将抛出OutOfMemoryError异常。

    运行时常量池:方法区的一部分。class文件中除了有类的版本、字段、方法、接口等描述信心外,还有一项信息是常量池,用于存放编译期生成的各种字面量和符号引用,这部分内容将在类加载后进入方法区的运行时常量池中存放。相对于class文件的常量池特征是具有动态性,也可以将新的常量放入池中(String类的intern方法),无法申请到内存时抛出OutOfMemoryError异常。JDK1.7后运行时常量池放在了堆中。

  • 直接内存:非运行时数据区,但是会发生OutOfMemoryError异常,会被频繁使用。NIO类可以使用native函数库直接分配堆外内存,然后存储在堆中的DirectByteBuffer对象会直接引用这块内存,避免了java堆和native堆来回复制数据。它的大小受本机总内存的影响。

     

内存分配与回收策略

  • 对象优先在Eden分配:大多数情况下对象在Eden上分配,当Eden没有足够的空间时,虚拟机发起一次Minor GC。

    Minor GC:发生在新生代的垃圾收集动作,因为Java大多数对象朝生夕灭,所以Minor GC比较频繁,一次回收速度比较快。

    Major GC/Full GC:老年代GC,出现则至少伴有一次Minor GC,Major GC速度比Minor GC慢10倍以上。

  • 大对象直接进老年代:需要大量连续内存空间的对象,如长字符串及数组。经常出现大对象容易提前触发垃圾收集。

  • 长期存活的对象进老年代:虚拟机每个对象定义一个对象年龄计数器。当对象在Eden出生并经过一次Minor GC后仍然存活,并能被Survivor容纳则将被移动到Survivor空间中,并且对象年龄设为1.对象在Survivor每熬过一次Minor GC,年龄加一,到达一定程度,默认15岁,就会被晋升到老年代。如果在Survivor空间相同年龄所有对象的大小总和大于空间的一半,年龄大于或等于该年龄的对象进入老年代。没必要等默认的15岁或者设置的值。

     

Java对象创建过程

大概过程:类加载检查、分配内存、初始化零值、设置对象头、执行init方法。

  • 类加载检查:虚拟机遇到new指令后,首先检查这条new指令的参数在常量池中是否有类引用,并检查这个类引用是否被加载、解析和初始化,如果没有则先执行类加载过程。

  • 分配内存:虚拟机为新生对象分配内存,对象所需的内存大小在类加载完后确定,划分方式根据内存是否规整有两种:

    a.内存规整:指针碰撞(分配内存就是移动指针)

    b.内存不规整:空闲列表(虚拟机维护一个列表,记录可用的内存块,分配的时候找到大小合适的内存块并更新列表记录)

    注:分配内存时Java堆是否规整取决于GC算法是否是标记整理算法。分配内存在并发场景下线程不安全,解决方法有两种:

    a.对分配内存的动作进行同步处理,采用CAS+失败重试保证更新操作的原子性。

    b.TLAB:把内存分配的动作按照线程划分在不同的空间中进行,即每个线程在Java堆中预先分配一小块内存,TLAB。分配内存时先在TLAB上分配,TLAB不够或用完时采用方式a。

  • 初始化零值:分配完内存后虚拟机需要将分配到的内存空间都初始化为零值,不包括对象头,如果使用TLAB,这一操作可以提前到TLAB分配时进行。这步操作保证了对象的实例字段在Java代码中可以不赋初始值就可以使用。

  • 设置对象头:虚拟机设置对象的必要信息,如类实例信息、元数据信息、对象的哈希码、对象的GC分代年龄,是否使用偏向锁

  • 执行init方法:执行完new指令后执行init方法。

 

对象的内存布局

对象在内存布局中划分为3块区域:对象头、实例数据、对齐填充。

  • 对象头:存储对象的运行时数据、如哈希码、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳,长度为32bit或64bit,不固定;另一部分为类型指针,虚拟机通过这个指针来确定这个对象是哪个类的实例。

  • 实例数据:代码中定义的各种类型的字段内容。父类中的变量会出现的子类之前,但是CompactFields为true时,子类中较窄的变量可能会插入父类变量的空隙中。

  • 对齐填充:起占位符作用。对象大小必须是8的整数倍,没对齐时填充。

     

对象的访问定位

对象的访问方式取决于虚拟机实现。目前主流的有句柄和直接指针两种。

  • 句柄:reference中存储对象的句柄地址,句柄中包含对象的实例数据与类型数据各自的具体地址。

       优点:移动对象后不需要改变引用本身,只需要改句柄中的实例数据指针。

 

  • 直接指针:reference中存储的就是对象实例数据指针,优点是访问速度快,节省了一次指针定位的开销。

 

判断对象死亡

垃圾收集之前要判断对象的存亡情况。对象死亡是指对象不可能再被使用。

  • 引用计数算法:给对象中添加一个引用计数器,有引用加1,引用失效减1,为0时对象不可再被使用。

  • 可达性分析算法:通过一系列的称为GC Roots的对象作为起始点开始向下搜索,走过的路径称为引用链,当一个对象到GC Roots没有任何引用链相连,则证明对象不可用。

    注:判断为不再引用的对象暂处缓刑阶段。

 

引用

  • 强引用:类似User u = new  User(),只要强引用还在,垃圾收集器永远不会回收被引用的对象。

  • 软引用:描述有用但非必须的对象。在系统将要发生内存溢出异常之前,将会把这些对象列进回收范围内进行二次回收。如果还不够才溢出。

  • 弱引用:描述非必须对象,比软引用更弱。被弱引用关联的对象只能生存到下一次垃圾收集发生之前,当进行回收时,就会被回收掉。

  • 虚引用:最弱的引用。无法通过虚引用获取对象实例,作用就是被垃圾回收前收到系统通知。

 

方法区的回收

回收废弃常量和无用类。无用类同时满足三个条件:

  • 该类所有实例被回收。

  • 加载该类的classLoader被回收。

  • 该类对应的java.lang.Class对象没有任何地方被引用,无法在任何地方通过反射访问该类的方法。

 

垃圾收集算法

  • 标记-清除算法Mark-Sweep:分为标记和清除两个阶段,先标记出所有要被回收的对象,完成后统一回收。

       缺点:效率低;空间碎片化严重。

  • 复制算法Copying:将可用内存划分为大小相等的两块,每次只用其中一块,当这一块用完,就将还存活的对象复制到另一块上,把已用的空间一次性清理掉。

       缺点:将内存缩小为原来的一半,成本高。

  • 标记-整理算法:标记过程与标记清除算法一样,后续不是直接清理内存,而是让还存活的对象移向一端,然后直接清理端边界以外的内存。

  • 分代收集算法:根据对象存活周期不同划分内存。一般把堆内存划分为新生代和老年代,各代根据特点采用最适当的算法。新生代对象存活率低采用复制算法,成本小。老年代对象存活率高、没有额外的空间对它进行分配担保,采用标记清除或标记整理。

 

垃圾回收器

  • Serial:单线程。暂停其他线程的工作,直到它收集结束。新生代采用复制算法,老年代使用标记整理算法。

  • Serial Old:Serial的老年代版本,使用标记整理算法,单线程。

  • ParNew:Serial的多线程版本。新生代采用复制算法,老年代使用标记整理算法。

  • Parallel Scarenge:关注吞吐量,新生代采用复制算法,老年代使用标记整理算法,并行的多线程收集器。

  • Parallel Old:Parallel Scarenge的老年代版本,多线程,使用标记整理算法。

  • CMS:以获取最短回收停顿时间为目标的收集器。使用标记清除算法。

  • G1:使用标记整理算法。

 

虚拟机类加载机制

虚拟机把类的数据从class文件加载到内存,并对数据进行校验、转换解析和初始化,最终形成可以被虚拟机直接使用的Java类型。加载、验证、准备、初始化和卸载顺序是确定的,解析阶段不一定,某种情况下可以在初始化阶段开始后再开始,如动态绑定。图示类加载的生命周期。

  • 加载

1.通过一个类的全限定名获取定义此类的二进制字节流

2.将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构。

3.在内存中生成一个代表这个类的Class对象,作为方法区这个类的各种数据的访问入口。

注:加载阶段和连接阶段的部分内容是交叉进行的。

  • 验证:为了确保Class文件的字节流中包含的信息符合当前虚拟机的要求。会完成以下四个阶段的校验:

1.文件格式校验

2.元数据验证

3.字节码验证

4.符号引用验证

  • 准备:正式为类变量分配内存并设置变量初始值。(static修饰的成员变量,在方法区中分配)

 

  • 解析:虚拟机将常量池内的符号引用替换为直接引用的过程。

符号引用:是以一组符号来描述所引用的目标,符号可以是任何形式的字面量,只要使用时能无歧义定位到目标即可。

直接引用:是直接指向目标的指针、相对偏移量或一个能间接定位到目标的句柄。

  • 初始化:以下五种情况下必须立即对类进行初始化(有且只有):

1.遇到new、getstatic、putstatic、invokestatic字节码指令时,具体场景是:使用new实例化对象、读取或设置一个类的静态字段的时候、调用类的静态方法的时候。

2.对类进行反射调用的时候。

3.初始化子类时发现父类没初始化,要先初始化父类。

4.虚拟机启动时,用户需要指定一个要执行的主类(包含main方法的类),虚拟机会先初始化这个主类。

5.JDK1.7动态语言,MethodHandle实例解析出getStatic...句柄,并且句柄对应类未初始化时。

初始化是执行类构造器<clinit>方法的过程,开始真正定义Java程序代码。<clinit>执行过程细节:

1.编译器自动收集类中所有的类变量的赋值动作和静态语句块中的语句合并产生的,编译器收集的顺序是由语句在源文件中出现的顺序决定的,静态语句块中只能访问到定义在静态语句块之前的变量,定义在它之后的变量在前面的静态语句块中可以赋值,但是不能访问。(非法向前引用)

2.它不需要显示调用,子类的该方法执行时父类的肯定已经执行完毕,所以虚拟机中第一个执行的该方法为Object的。

3.父类的静态语句块优先于子类的变量赋值操作。

4.该方法对于类或接口来说不是必须的,类中无静态语句块或对变量的赋值操作则不需要。

5.接口中无静态语句块但是可以对变量赋值,执行接口的该方法不需要先执行父接口的,只有当父接口中定义的变量使用时,父接口才会初始化,接口的实现类也是。

6.虚拟机会保证一个类的该方法在多线程环境下正确的加锁、同步。

 

类加载器

实现类的加载动作。

  • 启动类加载器:c++实现,是虚拟机的一部分。负责存放在<JAVA_HOME>\lib目录中或被-Xbootclasspath参数所指定的路径中的类。

  • 扩展类加载器:负责加载<JAVA_HOME>\lib\ext目录下或者java.ext.dirs系统变量所指定的路径下的类。

  • 应用程序类加载器:负责加载用户路径上所指定的类库,默认的。

 

双亲委派模型

双亲委派模型要求除了顶层的启动类加载器外,其他的类加载器都要有自己的父类加载器。

 

工作过程:类加载器收到类加载请求后不会先自己加载类,而是先让父类去加载,父类加载器不能完成加载时子类才会自己去加载。

 

附脑图:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值