第一章:JVM与Java体系结构
0:前言
作为Java工程师你曾经被伤害过吗?你是否遇到这些问题?
运行着的线上系统突然卡死,系统无法访问,甚至直接OOM!!!
-
想解决线上JVM GC的问题,但却无从下手;
-
新项目上线,对各种JVM参数设置一脸茫然,直接默认吧,然后就GC了
-
每次面试之前重新背诵一遍JVM的一些原理概念性的东西,然而面试官却经常问你在实际项目中如何调优VM 参数,如何解决 GC、OOM 等问题,一脸懵逼。
1:开发人员的病态
大部分 Java 开发人员,除会在项目中使用到与 Java 平台相关的各种高精尖技术,对于 Java 技术的核心 Java 虚拟机了解甚少。
一些有一定工作经验的开发人员,打心眼儿里觉得 SSM 、微服务等上层技术才是重点,基础技术并不重要,这其实是一种本末倒置的“病态”。如果我们把核心类库的 API 比做数学公式的话,那么 Java 虚拟机的知识就好比公式的推导过程。
计算机系统体系对我们来说越来越远,在不了解底层实现方式的前提下,通过高级语言很容易编写程序代码。但事实上计算机并不认识高级语言,只认识二进制;
2:架构师每天都在想什么?
-
如何让我们的系统更快;
-
如何避免系统出现瓶颈;
知乎上有条帖子:应该如何看招聘信息,直通年薪50万+?
-
参与现有系统的性能优化,重构,保证平台性能和稳定性;
-
根据业务场景和需求,决定技术方向,做技术选型;
-
能够独立设计架构,设计海量数据下高并发分布式解决方案,满足功能和非功能的需求;
-
解决各种潜在系统风险,核心功能的架构与代码编写;
-
分析系统瓶颈,解决各种疑难杂症,性能调优等
3:为什么要学习 JVM
-
面试的需要(BATJ、TMD,PKQ等面试都爱问)
-
中高级程序员必备技能
-
项目管理、调优的需求
-
追求极客的精神
-
比如:垃圾回收算法、JIT(及时编译器)、底层原理;有一些出奇的思想
4:Java vs C++
垃圾收集机制为我们打理了很多繁琐的工作,大大提高了开发的效率,但是,垃圾收集也不是万能的,懂得 JVM内部的内存结构、工作机制,是设计高扩展性应用和诊断运行时问题的基础,也是 Java 工程师进阶的必备能力。
虽然为我们简化了开发,减少了管理内存的代码,但是当我们遇到致命性问题的时候,这些都是需要了解其原理,才能轻而易举拿下的;
C 语言需要自己来分配内存和回收内存,Java 全部交给 JVM 进行分配和回收。
5:参考书目
英文文档规范:https://docs.oracle.com/javase/specs/index.html
《Java虚拟机规范》、《深入理解Java虚拟机》、《深入理解JVM&G1 GC》、《揭秘Java虚拟机》、《Java虚拟机基础教程》、《实战Java虚拟机》、《Java虚拟机精讲》、《码出高效 Java开发手册》
TIOBE 排行榜:https://www.tiobe.com/tiobe-index/
6:Java 生态圈
Java 是目前应用最为广泛的软件开发平台之一。随着 Java 以及 Java 社区的不断壮大 Java 也早已不再是简简单单的一门计算机语言了,它更是一个平台、一种文化、一个社区。
-
作为一个平台,Java 虚拟机扮演着举足轻重的作用
-
Groovy、Scala、JRuby、Kotlin等都是Java平台的一部分
-
-
作为一种文化,Java 几乎成为了“开源”的代名词。
-
第三方开源软件和框架。如Tomcat,MyBatis,Spring等。
-
就连 JDK 和 JVM 自身也有不少开源的实现,如OpenJDK、Harmony。
-
-
作为一个社区,Java 拥有全世界最多的技术拥护者和开源社区支持,有数不清的论坛和资料。从桌面应用软件、嵌入式开发到企业级应用、后台服务器、中间件,都可以看到 Java 的身影。其应用形式之复杂、参与人数之众多也令人咂舌。
7:Java的跨平台性
-
每个语言都需要转换成字节码文件,最后转换的字节码文件都能通过相应的虚拟机进行运行和处理
-
随着 Java 7 的正式发布,Java 虚拟机的设计者们通过 JSR-292 规范基本实现在 Java 虚拟机平台上运行非 Java语言编写的程序。
-
Java 虚拟机根本不关心运行在其内部的程序到底是使用何种编程语言编写的,它只关心“字节码”文件。也就是说 Java 虚拟机拥有语言无关性,并不会单纯地与 Java 语言“终身绑定”,只要其他编程语言的编译结果满足并包含 Java 虚拟机的内部指令集、符号表以及其他的辅助信息,它就是一个有效的字节码文件,就能够被虚拟机所识别并装载运行。
8:字节码
-
我们平时说的 Java 字节码,指的是用 Java 语言编译成的字节码。准确的说任何能在 JVM 平台上执行的字节码格式都是一样的。所以应该统称为:JVM 字节码。
-
不同的编译器,可以编译出相同的字节码文件,字节码文件也可以在不同的 JVM 上运行。
-
Java 虚拟机与 Java 语言并没有必然的联系,它只与特定的二进制文件格式— Class 文件格式所关联,Class 文件中包含了 Java 虚拟机指令集(或者称为字节码、Bytecodes)和符号表,还有一些其他辅助信息。
9:多语言混合编程
-
Java 平台上的多语言混合编程正成为主流,通过特定领域的语言去解决特定领域的问题是当前软件开发应对日趋复杂的项目需求的一个方向。
-
试想一下,在一个项目之中,并行处理用 Clojure 语言编写,展示层使用 JRuby/Rails ,中间层则是 Java ,每个应用层都将使用不同的编程语言来完成,而且,接口对每一层的开发者都是透明的,各种语言之间的交互不存在任何困难,就像使用自己语言的原生 API 一样方便,因为它们最终都运行在一个虚拟机之上。
-
对这些运行于 Java 虚拟机之上、Java 之外的语言,来自系统级的、底层的支持正在迅速增强,以 JSR-292 为核心的一系列项目和功能改进(如 Da Vinci Machine 项目、Nashorn 引擎、InvokeDynamic 指令、java.lang.invoke 包等),推动 Java 虚拟机从“Java 语言的虚拟机”向 “多语言虚拟机”的方向发展。
10:自己写个 JVM
-
Java虚拟机非常复杂,要想真正理解它的工作原理,最好的方式就是自己动手编写一个!
-
自己动手写一个Java虚拟机,难吗?
-
天下事有难易乎?为之,则难者亦易矣;不为,则易者亦难矣
11:Java发展的重大事件
-
1990年,在 Sun 计算机公司中,由 Patrick Naughton、MikeSheridan 及 James Gosling 领导的小组Green Team,开发出的新的程序语言,命名为 oak ,后期命名为 Java
-
1995年,Sun 正式发布 Java 和 HotJava 产品,Java 首次公开亮相。
-
1996年1月23日 Sun Microsystems 发布了 JDK 1.0。
-
1998年,JDK 1.2 版本发布。同时,Sun 发布了 JSP/Servlet、EJB 规范,以及将 Java 分成了 J2EE、J2SE 和 J2ME。这表明了 Java 开始向企业、桌面应用和移动设备应用3大领域挺进。
-
2000年,JDK 1.3 发布,Java HotSpot Virtual Machine 正式发布,成为 Java 的默认虚拟机。
-
2002年,JDK 1.4 发布,古老的 Classic 虚拟机退出历史舞台。
-
2003年年底,Java 平台的 Scala 正式发布,同年 Groovy 也加入了 Java 阵营。
-
2004年,JDK 1.5 发布。同时 JDK 1.5 改名为 JavaSE 5.0。
-
2006年,JDK 6 发布。同年,Java 开源并建立了 OpenJDK。顺理成章,HotSpot 虚拟机也成为了OpenJDK 中的默认虚拟机。
-
2007年,Java 平台迎来了新伙伴 Clojure。
-
2008年,Oracle 收购了 BEA,得到了 JRockit 虚拟机。
-
2009年,Twitter 宣布把后台大部分程序从 Ruby 迁移到 Scala ,这是 Java 平台的又一次大规模应用。
-
2010年,Oracle 收购了 Sun,获得 Java 商标和最真价值的 HotSpot 虚拟机。此时,Oracle 拥有市场占用率最高的两款虚拟机 HotSpot 和 JRockit,并计划在未来对它们进行整合:HotRockit
-
2011年,JDK 7 发布。在 JDK 1.7u4 中,正式启用了新的垃圾回收器 G1。
-
2017年,JDK 9 发布。将 G1 设置为默认 GC,替代 CMS
-
同年,IBM 的 J9 开源,形成了现在的 Open J9 社区
-
2018年,Android 的 Java 侵权案判决,Google 赔偿 Oracle 计88亿美元
-
同年,Oracle 宣告 JavaEE 成为历史名词 JDBC、JMS、Servlet 赠予 Eclipse 基金会
-
同年,JDK 11 发布,LTS 版本的 JDK,发布革命性的 ZGC,调整 JDK 授权许可
-
2019年,JDK 12 发布,加入 RedHat 领导开发的 Shenandoah GC
在 JDK 11 之前,OracleJDK 中还会存在一些 OpenJDK 中没有的、闭源的功能。但在 JDK 11 中,我们可以认为 OpenJDK 和 OracleJDK 代码实质上已经完全一致的程度。
12:虚拟机与 Java 虚拟机
12.1:虚拟机
所谓虚拟机(Virtual Machine),就是一台虚拟的计算机。它是一款软件,用来执行一系列虚拟计算机指令。大体上,虚拟机可以分为系统虚拟机和程序虚拟机。
-
大名鼎鼎的 Visual Box,VMware 就属于系统虚拟机,它们完全是对物理计算机的仿真,提供了一个可运行完整操作系统的软件平台。
-
程序虚拟机的典型代表就是 Java 虚拟机,它专门为执行单个计算机程序而设计,在 Java 虚拟机中执行的指令我们称为 Java 字节码指令。
-
无论是系统虚拟机还是程序虚拟机,在上面运行的软件都被限制于虚拟机提供的资源中。
12.2:Java虚拟机
-
Java 虚拟机是一台执行 Java 字节码的虚拟计算机,它拥有独立的运行机制,其运行的 Java 字节码也未必由 Java 语言编译而成。
-
JVM 平台的各种语言可以共享 Java 虚拟机带来的跨平台性、优秀的垃圾回器,以及可靠的即时编译器。
-
Java 技术的核心就是 Java 虚拟机(JVM,Java Virtual Machine),因为所有的 Java 程序都运行在 Java 虚拟机内部。
-
作用:Java 虚拟机就是二进制字节码的运行环境,负责装载字节码到其内部,解释/编译为对应平台上的机器指令执行。每一条 Java 指令,Java 虚拟机规范中都有详细定义,如怎么取操作数,怎么处理操作数,处理结果放在哪里。
-
特点:
-
一次编译,到处运行
-
自动内存管理
-
自动垃圾回收功能
-
13:JVM 的位置
JVM 是运行在操作系统之上的,它与硬件没有直接的交互
Java的体系结构
14:JVM 的整体结构
-
HotSpot VM是目前市面上高性能虚拟机的代表作之一。
-
它采用解释器与即时编译器并存的架构。
-
在今天,Java程序的运行性能早已脱胎换骨,已经达到了可以和C/C++程序一较高下的地步。
15:Java 代码执行流程
凡是能生成被Java虚拟机所能解释、运行的字节码文件,那么理论上我们就可以自己设计一套语言了
16:JVM 生命周期
16.1:虚拟机的启动
Java虚拟机的启动是通过引导类加载器(bootstrap class loader)创建一个初始类(initial class)来完成的,这个类是由虚拟机的具体实现指定的。
16.2:虚拟机的执行
-
一个运行中的Java虚拟机有着一个清晰的任务:执行Java程序
-
程序开始执行时他才运行,程序结束时他就停止
-
执行一个所谓的Java程序的时候,真真正正在执行的是一个叫做Java虚拟机的进程
16.3:虚拟机的退出
有如下的几种情况:
-
程序正常执行结束
-
程序在执行过程中遇到了异常或错误而异常终止
-
由于操作系统用现错误而导致Java虚拟机进程终止
-
某线程调用Runtime类或System类的exit()方法,或Runtime类的halt()方法,并且Java安全管理器也允许这次exit()或halt()操作。
-
除此之外,JNI(Java Native Interface)规范描述了用JNI Invocation API来加载或卸载 Java虚拟机时,Java虚拟机的退出情况。
16.4:查看虚拟机进程
代码:
public class StackStruTest {
public static void main(String[] args) {
int a = 1;
int b = 2;
int c = a + b;
try {
Thread.sleep(10000);
} catch (InterruptedException e) {
e.printStackTrace();
}
System.out.println("Hello");
}
}
趁程序还在运行的时候,赶快使用 jps 指令查看当前正在运行的进程,图中 4840 为进程所占用的端口号
StackStruTest 进行执行完毕,就查看不到咯
17:JVM 发展历程
17.1:Sun Classic VM
-
早在1996年Java1.0版本的时候,Sun公司发布了一款名为sun classic VM的Java虚拟机,它同时也是世界上第一款商用Java虚拟机,JDK1.4时完全被淘汰。
-
这款虚拟机内部只提供解释器,没有即时编译器,因此效率比较低,即时编译器会把热点代码缓存起来,那么以后使用热点代码的时候,效率就比较高。
-
如果使用JIT编译器,就需要进行外挂。但是一旦使用了JIT编译器,JIT就会接管虚拟机的执行系统。解释器就不再工作。解释器和编译器不能配合工作。
-
现在Hotspot内置了此虚拟机。
17.2:HotSpot VM
-
HotSpot历史
-
最初由一家名为“Longview Technologies”的小公司设计
-
1997年,此公司被Sun收购;2009年,Sun公司被甲骨文收购。
-
JDK1.3时,HotSpot VM成为默认虚拟机
-
-
目前Hotspot占有绝对的市场地位,称霸武林。
-
不管是现在仍在广泛使用的JDK6,还是使用比例较多的JDK8中,默认的虚拟机都是HotSpot
-
Sun/oracle JDK和openJDK的默认虚拟机
-
因此本课程中默认介绍的虚拟机都是HotSpot,相关机制也主要是指HotSpot的GC机制。(比如其他两个商用虚机都没有方法区的概念)
-
-
从服务器、桌面到移动端、嵌入式都有应用。
-
名称中的HotSpot指的就是它的热点代码探测技术。
-
通过计数器找到最具编译价值代码,触发即时编译或栈上替换
-
通过编译器与解释器协同工作,在最优化的程序响应时间与最佳执行性能中取得平衡
-
17.3:JRockit
-
专注于服务器端应用:它可以不太关注程序启动速度,因此JRockit内部不包含解析器实现,全部代码都靠即时编译器编译后执行。
-
大量的行业基准测试显示,JRockit JVM是世界上最快的JVM:使用JRockit产品,客户已经体验到了显著的性能提高(一些超过了70%)和硬件成本的减少(达50%)。
-
优势:全面的Java运行时解决方案组合
-
JRockit面向延迟敏感型应用的解决方案JRockit Real Time提供以毫秒或微秒级的JVM响应时间,适合财务、军事指挥、电信网络的需要
-
Mission Control服务套件,它是一组以极低的开销来监控、管理和分析生产环境中的应用程序的工具。
-
-
2008年,JRockit被Oracle收购。
-
Oracle表达了整合两大优秀虚拟机的工作,大致在JDK8中完成。整合的方式是在HotSpot的基础上,移植JRockit的优秀特性。
-
高斯林:目前就职于谷歌,研究人工智能和水下机器人
17.4:IBM的J9
-
全称:IBM Technology for Java Virtual Machine,简称IT4J,内部代号:J9
-
市场定位与HotSpot接近,服务器端、桌面应用、嵌入式等多用途VM广泛用于IBM的各种Java产品。
-
目前,有影响力的三大商用虚拟机之一,也号称是世界上最快的Java虚拟机。
-
2017年左右,IBM发布了开源J9VM,命名为openJ9,交给Eclipse基金会管理,也称为Eclipse OpenJ9
-
OpenJDK -> 是JDK开源了,包括了虚拟机
17.5:Taobao JVM
-
由AliJVM团队发布。阿里,国内使用Java最强大的公司,覆盖云计算、金融、物流、电商等众多领域,需要解决高并发、高可用、分布式的复合问题。有大量的开源产品。
-
基于OpenJDK开发了自己的定制版本AlibabaJDK,简称AJDK。是整个阿里Java体系的基石。
-
基于OpenJDK Hotspot VM发布的国内第一个优化、深度定制且开源的高性能服务器版Java虚拟机。
-
创新的GCIH(GCinvisible heap)技术实现了off-heap,即将生命周期较长的Java对象从heap中移到heap之外,并且GC不能管理GCIH内部的Java对象,以此达到降低GC的回收频率和提升GC的回收效率的目的。
-
GCIH中的对象还能够在多个Java虚拟机进程中实现共享
-
使用crc32指令实现JvM intrinsic降低JNI的调用开销
-
PMU hardware的Java profiling tool和诊断协助功能
-
针对大数据场景的ZenGC
-
-
taobao vm应用在阿里产品上性能高,硬件严重依赖inte1的cpu,损失了兼容性,但提高了性能
-
目前已经在淘宝、天猫上线,把Oracle官方JvM版本全部替换了。
18:总结
具体JVM的内存结构,其实取决于其实现,不同厂商的JVM,或者同一厂商发布的不同版本,都有可能存在一定差异。主要以Oracle HotSpot VM为默认虚拟机。