Java编译概览

原文:http://openjdk.java.net/groups/compiler/doc/compilation-overview/index.html


概述

将源文件编译成类文件并不是一个简单的过程,通常可以分成三个阶段。这个过程遵循按需处理的原则,因此不同源文件处理的速度不尽相同。

这个过程JavaCompiler来完成。

  1. 由命令行参数所指定的所有源文件会被parse成语法树,所有外部可见的定义都会enter到编译器的符号表。
  2. 调用所有适当的注解处理器。如果注解处理器产生了新的源文件或类文件,编译过程将重新开始,直到没有新的文件产生。
  3. 最后,解析器生成的语法树会被分析转换成类文件。在分析的过程中,可能会发现其他的被引用到的类(译者注:不是由命令行参数指定的类),编译器会检查源文件跟类文件路径,如果发现了这些类的源文件,那么这些文件也会被编译,但是不会对它们进行注解处理。

Parse 和 Enter

Scanner(译者注:词法分析器实现)将源文件进行Unicode转义处理,并转换成token流

token流被Parser读取,然后通过TreeMaker生成语法树。语法树由JCTree 的子类组成,这些子类实现了com.sun.source.Tree接口和它的子接口。

每一棵语法树都被交给Enter处理,Enter会将所有定义(译者注:成员变量,方法等)写入符号表。这个工作必须在分析语法树之前完成,因为语法树分析可能会引用到这些符号。这个阶段的输出是一个ToDo列表,其中包含了所有需要被分析并生成类文件的语法树。

Enter包括许多阶段,类通过队列从一个阶段进入另一个阶段。

class enter	→		Enter.uncompleted		→	MemberEnter (1)
			→	MemberEnter.halfcompleted	→	MemberEnter (2)
			→			To Do				→	(Attribute and Generate)
  1. 第1阶段,所有的类符号都会被enter到它们的enclosing scope中(译者注:enclScope.enter(c)),包括递归向下访问到的所有内部类。类符号会被设置一个 MemberEnter 对象作为 completer
    此外,如果发现任何带有包注解的package-info.java文件,它的top level语法树也会被放进ToDo列表。
  2. 第2阶段,执行MemberEnter.complete()。这个阶段是按需执行的, 所有未完成的类最终都会通过uncompleted队列处理完成。执行的操作包括,
    (1) 确定一个类的参数,父类和接口。
    (2) 所有在类中定义的符号(译者注:成员变量,方法等)enter到它们的scope中,除了在第1阶段已经处理过的类符号。
    (2) 依赖于一个类及其父类和内部类都完成了(1),这就是为什么在(1)之后我们将类放入一个halfcompleted队列。只有对一个类及其父类和内部类都执行了(1),我们才能进入(2)。
  3. 当所有符号都enter到符号表,这些符号上的任何注解都将被分析和验证。

第1阶段将对所有语法树进行,而第2阶段则是按要求来的。只有第一次访问类时,类成员才会enter到符号表。这是通过对相应的语法树设置MemberEnter对象作为completer来实现的。

注解处理

这部分由JavacProcessingEnvironment来处理。

概念上讲注解处理(译者注:对应下图中的Annotation processing)是编译(译者注:对应下图中的Compilation)前的一个准备步骤。这个过程由一系列回合组成,每一个回合都要parse和enter源文件,并调用适当的注解处理器。首个回合结束之后,如果注解处理器产生了新的源文件或类文件,这些文件在最终的编译中是必需的,那么将进行下一个回合。最后,当所有回合执行结束,真正的编译就将开始了。

而实际上,注解处理器的调用,在源文件被解析并且确定文件中所包含的声明之前,可能是不清楚的。因此,为了避免当不需要执行注解处理时无谓的文件解析(译者注:这里说的应该是避免第一回合的parse和enter?),JavacProcessingEnvironment采用了“out of phase”这样的概念模型,这仍然满足了注解处理作为一个整体在编译之前进行这样的概念需要。

JavacProcessingEnvironment在源文件parse和enter之后被调用。它确定了所有需要被加载和调用的注解处理器(译者注:由option指定,NameProcessIterator,或者spi方式查找,ServiceIterator)。通常情况下,如果在整个编译过程中有任何的错误发生,编译过程将在下一个合适的点停下来。然而有一个例外,就是在Enter阶段发现符号的缺失。这是因为缺失的符号定义有可能是由注解处理器产生的。

如果注解处理器将要被执行,它们会由单独的类加载器加载并运行。

当注解处理器运行完之后,JavacProcessingEnvironment会确定还需不需要进行下一回合的注解处理。如果需要,它将创建一个新的JavaCompiler对象,读取所有新创建的源文件,并重用之前解析过的语法树。这些语法树都会被enter到这个新的JavaCompiler实例的符号表,如果需要将会调用注解处理器。这一步会一直重复直到不再需要新一轮的注解处理。

最后,JavacProcessingEnvironment将会返回一个JavaCompiler对象,用于剩余的编译过程。这个对象有可能是最初用于parse跟enter的那个实例,也有可能是JavacProcessingEnvironment创建的用于最后一轮编译的实例。

Analyse 和 Generate

一旦由命令行所指定的所有源文件被parse并enter到JavaCompiler的符号表,并且所有的注解处理都完成了,JavaCompiler就可以开始分析语法树了,这些解析后的语法树现在就是等着生成相应的类文件了。

在分析语法树的过程中,可能会遇到一些被引用的类,而这些类并没有显式的指定要进行编译。这时候编译器会依赖于编译选项,在源文件路径(译者注:OptionName#SOURCEPATH)和类文件路径(译者注:OptionName#CLASSPATH)搜索这些类的定义。如果在一个类文件中找到了这个定义,那么这个类文件将被读取以确定这个定义;如果是在一个源文件中找到的,那么这个源文件将会被parse和enter,并且放入ToDo列表。这一步是通过让JavaCompiler实现了ClassReader.SourceCompleter接口来完成的(译者注:原文貌似有误,写的是Attr.SourceCompleter)。

分析语法树并生成类文件的工作是通过一系列的Visitor处理ToDo列表来完成的。并不需要让这些Visitor同步的来处理所有源文件,实际上,内存问题会让这一切变得完全不能接受。唯一的要求是,ToDo列表中的每一项最终都必须被每一个Visitor处理过,除非由于产生错误而导致了编译提前终止。

Attr

使用Attr将top level的类“属性化”,“属性化“的意思就是说,语法树里面的名字,表达式还有其他节点都会被解析并和相应的类型符号关联。通过Attr或者Check都可能会检查到许多的语义错误。

Flow

如果没有产生任何错误,流分析会开始进行,通过Flow完成。流分析包括变量的definite assignment分析,检查是否有不可达的语句,因此流分析可能会产生一些附加的错误。

TransTypes

通过TransTypes将使用泛型的代码转换成没有泛型的代码。

Lower

使用Lower来处理语法糖,Lower会重写语法树,用等价的、简化了的语法树来替换某些特殊类型的子树。包括了嵌套类、内部类,类字面常量,断言,foreach循环等等。对于每一个被处理的类,Lower都会返回一个语法树列表,这个列表包含了被转换后的类,以及它的所有被转换后的嵌套类和内部类。

尽管Lower一般是处理top level的类,它也可以处理package-info.java的top level语法树的。这种情况下,Lower会自己创建一个类来持有包上面的任何注解。

Gen

方法的代码由Gen来生成,Gen生成了Code属性,Code属性包含了JVM执行方法所需要的字节码。如果这一步成功了,ClassWriter将会写出类文件。

当写出类文件之后,这个类的语法树中的大部分(译者注:例如常量池)以及生成的字节码已经不再需要了。为了节省内存,相应的引用将会被置为null,以便进行内存回收。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
这本书的内容是帮你全面了解java虚拟机,本书第1版两年内印刷近10次,98%以上的评论全部为5星级的好评,是整个Java图书领域公认的经典著作和超级畅销书,繁体版在台湾也十分受欢迎。第2版在第1版的基础上做了很大的改进:根据最新的JDK1.7对全书内容进行了全面的升级和补充;增加了大量处理各种常见JVM问题的技巧和最佳实践;增加了若干与生产环境相结合的实战案例;对第1版中的错误和不足之处的修正;等等。 第2版不仅技术更新、内容更丰富,而且实战性更强。全书共分为五大部分,围绕内存管理、执行子系统、程序编译与优化、高效并发等核心主题对JVM进行了全面而深入的分析,深刻揭示了JVM的工作原理。第一部分从宏观的角度介绍了整个Java技术体系、Java和JVM的发展历程、模块化,以及JDK的编译,这对理解本书后面内容有重要帮助。第二部分讲解了JVM的自动内存管理,包括虚拟机内存区域的划分原理以及各种内存溢出异常产生的原因;常见的垃圾收集算法以及垃圾收集器的特点和工作原理;常见虚拟机监控与故障处理工具的原理和使用方法。第三部分分析了虚拟机的执行子系统,包括类文件结构、虚拟机类加载机制、虚拟机字节码执行引擎。第四部分讲解了程序的编译与代码的优化,阐述了泛型、自动装箱拆箱、条件编译等语法糖的原理;讲解了虚拟机的热点探测方法、HotSpot的即时编译器、编译触发条件,以及如何从虚拟机外部观察和分析JIT编译的数据和结果;第五部分探讨了Java实现高效并发的原理,包括JVM内存模型的结构和操作;原子性、可见性和有序性在Java内存模型中的体现;先行发生原则的规则和使用;线程在Java语言中的实现原理;虚拟机实现高效并发所做的一系列锁优化措施。 前言 第一部分 走近Java 第1章 走近Java 1.1 概述 1.2 Java技术体系 1.3 Java发展史 1.4 Java虚拟机发展史 1.4.1 Sun Classic Exact VM 1.4.2 Sun HotSpot VM 1.4.3 Sun Mobile-Embedded VM Meta-Circular VM 1.4.4 BEA JRockit IBM J9 VM 1.4.5 Azul VM BEA Liquid VM 1.4.6 Apache Harmony Google Android Dalvik VM 1.4.7 Microsoft JVM及其他 1.5 展望Java技术的未来 1.5.1 模块化 1.5.2 混合语言 1.5.3 多核并行 1.5.4 进一步丰富语法 1.5.5 64位虚拟机 1.6 实战:自己编译JDK 1.6.1 获取JDK源码 1.6.2 系统需求 1.6.3 构建编译环境 1.6.4 进行编译 1.6.5 在IDE工具中进行源码调试 1.7 本章小结 第二部分 自动内存管理机制 第2章 Java内存区域与内存溢出异常 2.1 概述 2.2 运行时数据区域 2.2.1 程序计数器 2.2.2 Java虚拟机栈 2.2.3 本地方法栈 2.2.4 Java堆 2.2.5 方法区 2.2.6 运行时常量池 2.2.7 直接内存 2.3 HotSpot虚拟机对象探秘 2.3.1 对象的创建 2.3.2 对象的内存布局 2.3.3 对象的访问定位 2.4 实战:OutOfMemoryError异常 2.4.1 Java堆溢出 2.4.2 虚拟机栈和本地方法栈溢出 2.4.3 方法区和运行时常量池溢出 2.4.4 本机直接内存溢出 2.5 本章小结 第3章 垃圾收集器与内存分配策略 3.1 概述 3.2 对象已死吗 3.2.1 引用计数算法 3.2.2 可达性分析算法 3.2.3 再谈引用 3.2.4 生存还是死亡 3.2.5 回收方法区 3.3 垃圾收集算法 3.3.1 标记-清除算法 3.3.2 复制算法 3.3.3 标记-整理算法 3.3.4 分代收集算法 3.4 HotSpot的算法实现 3.4.1 枚举根节点 3.4.2 安全点 3.4.3 安全区域 3.5 垃圾收集器 3.5.1 Serial收集器 3.5.2 ParNew收集器 3.5.3 Parallel Scavenge收集器 3.5.4 Serial Old收集器 3.5.5 Parallel Old收集器 3.5.6 CMS收集器 3.5.7 G1收集器 3.5.8 理解GC日志 3.5.9 垃圾收集器参数总结 3.6 内存分配与回收策略 3.6.1 对象优先在Eden分配 3.6.2 大对象直接进入老年代 3.6.3 长期存活的对象将进入老年代 3.6.4 动态对象年龄判定 3.6.5 空间分配担保 3.7 本章小结 第4章 虚拟机性能监控与故障处理工具 4.1 概述 4.2 JDK的命令行工具 4.2.1 jps:虚拟机进程状况工具 4.2.2 jstat:虚拟机统计信息监视工具 4.2.3 jinfo:Java配置信息工具 4.2.4 jmap:Java内存映像工具 4.2.5 jhat:虚拟机堆转储快照分析工具 4.2.6 jstack:Java堆栈跟踪工具 4.2.7 HSDIS:JIT生成代码反汇编 4.3 JDK的可视化工具 4.3.1 JConsole:Java监视与管理控制台 4.3.2 VisualVM:多合一故障处理工具 4.4 本章小结 第5章 调优案例分析与实战 5.1 概述 5.2 案例分析 5.2.1 高性能硬件上的程序部署策略 5.2.2 集群间同步导致的内存溢出 5.2.3 堆外内存导致的溢出错误 5.2.4 外部命令导致系统缓慢 5.2.5 服务器JVM进程崩溃 5.2.6 不恰当数据结构导致内存占用过大 5.2.7 由Windows虚拟内存导致的长时间停顿 5.3 实战:Eclipse运行速度调优 5.3.1 调优前的程序运行状态 5.3.2 升级JDK 1.6的性能变化及兼容问题 5.3.3 编译时间和类加载时间的优化 5.3.4 调整内存设置控制垃圾收集频率 5.3.5 选择收集器降低延迟 5.4 本章小结 第三部分 虚拟机执行子系统 第6章 类文件结构 6.1 概述 6.2 无关性的基石 6.3 Class类文件的结构 6.3.1 魔数与Class文件的版本 6.3.2 常量池 6.3.3 访问标志 6.3.4 类索引、父类索引与接口索引集合 6.3.5 字段表集合 6.3.6 方法表集合 6.3.7 属性表集合 6.4 字节码指令简介 6.4.1 字节码与数据类型 6.4.2 加载和存储指令 6.4.3 运算指令 6.4.4 类型转换指令 6.4.5 对象创建与访问指令 6.4.6 操作数栈管理指令 6.4.7 控制转移指令 6.4.8 方法调用和返回指令 6.4.9 异常处理指令 6.4.10 同步指令 6.5 公有设计和私有实现 6.6 Class文件结构的发展 6.7 本章小结 第7章 虚拟机类加载机制 7.1 概述 7.2 类加载的时机 7.3 类加载的过程 7.3.1 加载 7.3.2 验证 7.3.3 准备 7.3.4 解析 7.3.5 初始化 7.4 类加载器 7.4.1 类与类加载器 7.4.2 双亲委派模型 7.4.3 破坏双亲委派模型 7.5 本章小结 第8章 虚拟机字节码执行引擎 8.1 概述 8.2 运行时栈帧结构 8.2.1 局部变量表 8.2.2 操作数栈 8.2.3 动态连接 8.2.4 方法返回地址 8.2.5 附加信息 8.3 方法调用 8.3.1 解析 8.3.2 分派 8.3.3 动态类型语言支持 8.4 基于栈的字节码解释执行引擎 8.4.1 解释执行 8.4.2 基于栈的指令集与基于寄存器的指令集 8.4.3 基于栈的解释器执行过程 8.5 本章小结 第9章 类加载及执行子系统的案例与实战 9.1 概述 9.2 案例分析 9.2.1 Tomcat:正统的类加载器架构 9.2.2 OSGi:灵活的类加载器架构 9.2.3 字节码生成技术与动态代理的实现 9.2.4 Retrotranslator:跨越JDK版本 9.3 实战:自己动手实现远程执行功能 9.3.1 目标 9.3.2 思路 9.3.3 实现 9.3.4 验证 9.4 本章小结 第四部分 程序编译与代码优化 第10章 早期(编译期)优化 10.1 概述 10.2 Javac编译器 10.2.1 Javac的源码与调试 10.2.2 解析与填充符号表 10.2.3 注解处理器 10.2.4 语义分析与字节码生成 10.3 Java语法糖的味道 10.3.1 泛型与类型擦除 10.3.2 自动装箱、拆箱与遍历循环 10.3.3 条件编译 10.4 实战:插入式注解处理器 10.4.1 实战目标 10.4.2 代码实现 10.4.3 运行与测试 10.4.4 其他应用案例 10.5 本章小结 第11章 晚期(运行期)优化 11.1 概述 11.2 HotSpot虚拟机内的即时编译器 11.2.1 解释器与编译器 11.2.2 编译对象与触发条件 11.2.3 编译过程 11.2.4 查看及分析即时编译结果 11.3 编译优化技术 11.3.1 优化技术概览 11.3.2 公共子表达式消除 11.3.3 数组边界检查消除 11.3.4 方法内联 11.3.5 逃逸分析 11.4 Java与CC++的编译器对比 11.5 本章小结 第五部分 高效并发 第12章 Java内存模型与线程 12.1 概述 12.2 硬件的效率与一致性 12.3 Java内存模型 12.3.1 主内存与工作内存 12.3.2 内存间交互操作 12.3.3 对于volatile型变量的特殊规则 12.3.4 对于long和double型变量的特殊规则 12.3.5 原子性、可见性与有序性 12.3.6 先行发生原则 12.4 Java与线程 12.4.1 线程的实现 12.4.2 Java线程调度 12.4.3 状态转换 12.5 本章小结 第13章 线程安全与锁优化 13.1 概述 13.2 线程安全 13.2.1 Java语言中的线程安全 13.2.2 线程安全的实现方法 13.3 锁优化 13.3.1 自旋锁与自适应自旋 13.3.2 锁消除 13.3.3 锁粗化 13.3.4 轻量级锁 13.3.5 偏向锁 13.4 本章小结 附  录 附录A 编译Windows版的OpenJDK 附录B 虚拟机字节码指令表 附录C HotSpot虚拟机主要参数表 附录D 对象查询语言(OQL)简介 附录E JDK历史版本轨迹
提供的源码资源涵盖了Java应用等多个领域,每个领域都包含了丰富的实例和项目。这些源码都是基于各自平台的最新技术和标准编写,确保了在对应环境下能够无缝运行。同时,源码中配备了详细的注释和文档,帮助用户快速理解代码结构和实现逻辑。 适用人群: 适合毕业设计、课程设计作业。这些源码资源特别适合大学生群体。无论你是计算机相关专业的学生,还是对其他领域编程感兴趣的学生,这些资源都能为你提供宝贵的学习和实践机会。通过学习和运行这些源码,你可以掌握各平台开发的基础知识,提升编程能力和项目实战经验。 使用场景及目标: 在学习阶段,你可以利用这些源码资源进行课程实践、课外项目或毕业设计。通过分析和运行源码,你将深入了解各平台开发的技术细节和最佳实践,逐步培养起自己的项目开发和问题解决能力。此外,在求职或创业过程中,具备跨平台开发能力的大学生将更具竞争力。 其他说明: 为了确保源码资源的可运行性和易用性,特别注意了以下几点:首先,每份源码都提供了详细的运行环境和依赖说明,确保用户能够轻松搭建起开发环境;其次,源码中的注释和文档都非常完善,方便用户快速上手和理解代码;最后,我会定期更新这些源码资源,以适应各平台技术的最新发展和市场需求。 所有源码均经过严格测试,可以直接运行,可以放心下载使用。有任何使用问题欢迎随时与博主沟通,第一时间进行解答!

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值