一时冲动:“通往瓦尔哈拉之路的冒险”

通过所有有关Java 9Project Jigsaw的讨论,我们不应忽视Java的另一重大变化。 希望在第10版或第11版中, Valhalla项目能够实现并介绍价值类型和专业化。

那么这是怎么回事,项目进展如何,面临什么挑战? 几天前,Oracle Java语言架构师和Valhalla项目负责人Brian Goetz在JVM Language Summit 2015上的一次演讲中回答了这些问题。

我们来看一下。

总览

这篇文章将介绍Goetz演讲“冒险到Valhalla的道路”的四个部分中的三个。

他以序言开头,我为那些尚不了解Valhalla项目的人提供了一些补充说明。 Goetz继续展示这两个原型,其中第一个原型于去年公开发布,第二个原型仅在两周前发布。 由于这篇文章已经足够长了,因此我将不讨论他关于未来实验的最后一部分。 如果您觉得这个话题很有趣,那么一定要看整个演讲!

全文中的所有引用均来自幻灯片或逐字记录。

谈话

这里是谈话:

(顺便说一句,JVMLS团队在几个小时内将所有讨论都在线上获得了赞誉!)

如果您可以节省50分钟,那就去看吧! 然后,无需阅读这篇文章。

要点

序幕

Valhalla项目涉及的两个主要主题是价值类型通用专业化

值类型

前者将允许用户定义具有相同属性(如不变性,相等性而不是标识)的“类似int”的类型,以及由此产生的性能优势。 它们之前是Java 8的基于值的类

(除非另有说明,否则当本文章的其余部分讨论基元时,将包括值类型。)

通用专业化

随着每个人都声明自己的原始类型,泛型无法在它们之上工作的事实(即,没有ArrayList<int> )引起的问题变得令人无法忍受。 从概念的角度来看,虽然必须对原语进行装箱,但它具有显着的性能成本。

首先,存储对象而不是基元会花费额外的内存(例如,对象标头)。 然后,更糟的是,装箱会破坏缓存的局部性 。 当CPU缓存Integer -array时,它仅获取指向实际值的指针。 提取这些是额外的随机内存访问。 当CPU主要在等待高速缓存未命中时,这种额外级别的间接开销将付出巨大的代价,并可能破坏并行化。

因此,Valhalla项目的另一个目标是扩大参数多态性的范围,以使泛型能够覆盖基元。 为了获得成功,JVM应该使用基元而不是用于通用类中的通用字段,参数和返回值的框。

由于可能的实现方式,这称为通用专门化

因此,泛型需要与值类型很好地配合使用,并且原语可以伴随而来。

泛型的现状

由于擦除,类型变量被擦除到其边界,即ArrayList<Integer>实际上变为ArrayList<Object> (或者只是ArrayList )。 这样的界限必须是所有可能实例化的超类型。 但是Java在基本类型和引用类型之上没有类型。

另外,JVM字节码指令通常是正交的,即沿相同的行分割。 一个aloadastore只能移动引用。 专业变体具有用于原语,如iloadistoreint 。 没有字节码可以同时移动引用和int

因此,类型系统和字节码指令集都无法完成生成原语的任务。 十多年前开发出仿制药时,这已广为人知,作为一种折衷,决定是根本不允许这样做。

今天的问题来自昨天的解决方案……

兼容性!

当然,Valhalla项目下发生的所有事情都必须向后兼容。 这有几种形式:

  • 二进制兼容性:现有的字节码,即已编译的类文件,必须继续表示同一意思。 这样可以确保依赖项继续工作而无需重新编译。
  • 源代码兼容性:源文件必须继续具有完全相同的含义,因此重新编译它们一定不能“仅仅因为语言已更改”而更改任何内容。
  • 迁移兼容性:来自不同Java版本的编译类必须协同工作,以允许一次迁移一个依赖项。

另一个要求是,不要使JVM模仿太多的Java语言。 这样做将迫使其他JVM语言处理Java语言的语义。

原型模型1:使其工作

大约一年前,Goetz和他的同事提出了第一个专业化实验性实施方案。

想法

在此原型中,编​​译器继续生成已擦除的类文件,但使用其他类型信息对其进行了扩充。

VM会忽略此信息,但将由专化器使用 ,这是类加载器的新组成部分。 后者将识别何时需要带有原始类型参数的类,并让专门化工具从已删除但已增强的类文件中即时生成它。

通过擦除,一个类的所有通用实例都使用相同的类文件。 相反,为每种原始类型创建一个新的类文件称为specialization

细节

在该原型中,使用“名称处理技术”描述了专门的类。 类名后面附加一个字符串,该字符串指示哪种类型参数专用于哪个原语。 例如, ArrayList${0=I}意思是“用第一个类型变量int实例化的ArrayList ”。

在专业化期间,必须更改签名字节码。 为了正确地做到这一点,专门化者需要知道哪些Object出现(所有通用类型都被擦除了)必须被专门化为哪种类型。 所需的签名信息已经大部分存在于类文件中,并且原型使用附加的类型元数据注释字节码。

从Goetz的8:44开始 ,它给出了几个如何进行的示例。 他还使用它们来指出这种实现必须要注意的一些细节,例如泛型方法的主题。

我知道那是很多快速的挥手。 关键是,这很简单,但是却有很多复杂性。

摘要

该实验表明,基于类文件元数据的即时专业化无需更改虚拟机即可工作。 这些都是重要的成就,但也有不利的弊端。

首先,它需要实现一组复杂的细节。

其次,也许是最重要的是,它具有有问题的类型系统特征。 在不更改VM的情况下,仍然没有intString公共超类型,因此也没有ArrayList<int>ArrayList<String>公共超类型。 这意味着没有办法声明“ ArrayList任何实例”。

第三,这具有可怕的代码共享属性。 即使ArrayList<int>ArrayList<String>大部分代码是相同的,也可以在ArrayList${0=I}ArrayList复制它们。

死亡减少1000点。

原型模型2:抢救通配符

第二个非常新的原型解决了有问题的类型系统特征。

问题

当前,无界通配符表示“类的任何实例”,例如ArrayList<?>表示“任何ArrayList ”。 它们被大量使用,尤其是库开发人员。 在ArrayList<int>ArrayList<String>是不同类的系统中,通配符可能更为重要,因为它们弥合了它们之间的鸿沟并“表达了基本的ArrayList -ness”。

但是,如果我们假设ArrayList<?>ArrayList<int>的超类型,那么我们最终会遇到需要多个类继承的情况。 原因是ArrayList<T>扩展了AbstractList<T>因此我们也希望ArrayList<int>扩展AbstractList<int> 。 现在, ArrayList<int>将扩展ArrayList<?>AbstractList<int> (它们没有继承关系)。

在通往瓦尔哈拉项目的多重继承路上

(请注意,与当前泛型的区别在于擦除。在VM中, ArrayList<Integer>ArrayList<?>是同一类ArrayList,可以自由扩展AbstractList。)

根本原因是,虽然ArrayList<?>看起来像是“ any ArrayList ”,但实际上是ArrayList< ?。 扩展Object> ,即“引用类型上的任何ArrayList ”。

想法

原型引入了带有refvalany的新的通配符层次结构:

  • ref包含所有引用类型并替换?
  • val包含所有原语和值类型(原型当前不支持该值,并且在谈话中未提及,但已在Valhalla邮件列表中宣布
  • any包含refval

专用类的多重继承将通过使用合成接口表示任意类型来解决。 ArrayList<int>将因此扩展AbstractList<int>并实现ArrayList<any>

细节
层次结构

ArrayList<ref> (即ArrayList<?> )将继续为已擦除类型。

为了表示ArrayList<any> ,编译器将创建一个接口ArrayList$any 。 它会由ArrayList生成的所有类(例如ArrayList<int>和已擦除的ArrayList )实现,并将扩展与超类相对应的所有综合接口,例如AbstractList$anyAbstractList<any>

在通往Valhalla任何接口的道路上冒险

该接口将包含该类的所有方法的声明以及其字段的访问器。 因为仍然没有对象和基元的公共超类型,所以必须将其通用参数和返回类型装箱。

但是,如果类以ArrayList<any>的方式访问而该访问是直接针对的,例如ArrayList<int> ,则只需采取这种绕行方式。 因此,装箱的性能成本仅由使用通配符的开发人员承担,而使用原始专业化的代码直接获得预期的改进性能。

它干净利落地工作。

你不应该相信我,事情变得复杂了。 但这是个好故事。 我们会继续前进。

从Goetz的26:33开始,提供一些示例来解释一些细节。

辅助功能

可访问性是VM需要更改的区域。 到目前为止,接口不能具有私有或包可见的方法。 (在Java 9中,可以使用私有默认方法,但这在这里无济于事,因为需要实现。)

一个联系在一起但更老的问题是,即使VM不允许这样做,外部类及其内部类也可以互相访问私有成员,因为VM不允许这样做,因为它们都是无关的类。 当前,这是通过生成桥接方法(即具有较高可见性的方法,而不是无法访问的私有成员)来解决的。

为专门的类创建更多的桥接方法将是可能的,但是很费力。 相反,可能的更改是创建类嵌套的概念。 它包含所有专用类和内部类,并且VM允许访问嵌套内部的私有成员。

这将使语言的解释与VM的解释保持一致,VM的语言将所有专业化知识和内部类作为一个单元,而VM直到现在只看到一堆不相关的类。

数组

通用方法也可以采用或返回数组。 但是,尽管专业化可以将一个int到一个Object上,但int[]Object[]并且将每个单独的int装箱是一个糟糕的主意。

Arrays 2.0可能在这里有所帮助。 因为讨论需要基本熟悉该提案,所以我不会详细介绍。 总而言之,看起来他们将解决问题。

摘要

语言的更改在概念上很简单。 在没有任何变化的情况下。 类型变量可以用任何修饰,如果需要将实例分配给通配符类型,则通配符也必须使用任何通配符。

通过使用原始类型和引用类型(例如ArrayList<any> )的泛型类的通用超类型,所得的编程模型更加合理。 在谈到他的团队将Stream API移植到此原型的经验时,Goetz说:

真的很顺利。 这正是您想要的。 大约70%的代码刚刚消失,因为所有手工专门化的原始东西都消失了,然后许多支持手工专门化的复杂机制也消失了,三年级的学生可以成为一个简单的图书馆写。 因此,我们认为这是一个非常成功的实验。

与现有代码的兼容性也很好。

不幸的是,第一个原型的不良代码共享属性仍然存在。 ArrayList<int>ArrayList<String>仍然是不同的类,它们非常相似,但不共享任何代码。 在下一篇文章中我将不介绍的下一部分将解决该问题,并提出解决该问题的可能方法。

反射

谈话非常密集,涉及很多领域。 我们已经看到,值类型的引入和期望的性能改进需要通用的专业知识,因此可以减少甚至防止装箱。

第一个原型通过在装入类时专门化类来实现这一目标,而无需更改JVM。 但是,存在一个问题,即一个类的所有实例都没有通用的超类型,因为原始类型和引用类型参数会产生完全不相关的类。 第二个原型引入了通配符refvalany并使用合成接口表示任意类型。

这一切都非常令人兴奋,我等不及要尝试一下! 不幸的是,我要去度假,所以我不能一会儿了。 愚蠢的现实生活…别在我走后就破坏事物!

翻译自: https://www.javacodegeeks.com/2015/08/impulse-adventures-on-the-road-to-valhalla.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值