oracle number对应java什么类型_JVM系列之数据类型

263cc8c009b19718f747332690bbbadc.png
码神手记——资深攻城狮的私房笔记。微信公众平台/知乎/头条/简书同步发文,关注、转发、收藏。

数据类型、类加载机制、JVM内存模型,很多人在面试中都会遇到这一类的问题。大部分人都是死记硬背,背完就忘。究其原因,是对JVM规范的不了解,没有内功,招式只是花架子。本篇是JVM系列的开篇,将从数据类型开始,一起深入学习JVM规范。

为确保严谨准确,参考资料为Oracle官方文档《The Java® Virtual Machine Specification》。

JVM规范与Java编程语言什么关系?

我们可以认为JVM是一个虚拟的计算机,而JVM规范就是这台计算机的设计蓝图,一个极度抽象的体系结构。它清晰地定义了数据类型、内存、操作指令语义等。平时经常提到的JVM一般是指HotSpot虚拟机,它只是对JVM规范的一种实现。任何人都可以在这套规范的约束下实现一个属于自己的虚拟机实例。

用Java编程语言编写出Java源代码文件,经过编译器的编译后产生class文件,class文件可以被JVM识别并执行。即便只是用记事本写了一段非Java的火星文,只要你可以将它编译成JVM能够识别的class文件,照样可以运行。Kotlin语言就是一个成功案例。在JVM系列的后续文章中会专门介绍面向JVM的编译。

不要将JVM规范与Java编程语言混为一谈,后续内容的上下文都是JVM规范体系内的。

接下来,言归正传。

7b7efda50c1fade05bfb27bb3e9eb6cd.png
关注订阅号:码神手记,私信发送关键字:JVM,获取高清完整版JVM知识体系图

数据类型分类

JVM操作两种类型:基本(原生)类型和引用类型。它们的值分别称为原生值和引用值,可以作为参数传递、作为返回值由方法返回、对其进行一系列的操作。

JVM期望尽可能多的类型检查(最好是所有的)都在进入运行时之前完成,通常是由编译器完成。对于基本类型的值,虚拟机使用对特定类型值进行操作的指令来区分类型,不需要专门标记类型。例如:iadd、ladd、fadd和dadd都是计算两个数值之和的虚拟机指令,每个指令都有其专门针对的操作数类型:int、long、float和double。

JVM对对象显式支持,对象可以是动态分配的类实例,也可以是数组。对对象的引用即虚拟机类型引用,类型引用的值可以看作是指向对象的指针,一个对象可以存在多个引用。对象总是通过类型引用的值被操作、传递。

基本类型

JVM支持的基本类型分为:数值类型、布尔类型和返回地址类型(returnAddress)。数值类型又分为:整数类型、浮点类型。

整数类型

  • byte,字节类型,8位有符号二补整数,默认值是0,取值范围是
    ​。
  • short,短整型,16位有符号二补整数,默认值是0,取值范围是
    ​。
  • int,整型,32位有符号二补整数,默认值是0,取值范围是
    ​。
  • long,长整型,64位有符号二补整数,默认值是0,取值范围是​
  • char,字符型,16位无符号,取值范围从0到65535。使用基本多文种平面中的Unicode代码点表示的整数,用UTF-16编码,默认值为null,UTF-16编码是u0000

浮点类型

  • float,单精度浮点类型,其值属于浮点值集中的元素,或(在支持的情况下)浮点扩展指数值集中的元素,默认值是0。
  • double,双精度浮点类型,其值是双精度值集中的元素,或(在支持的情况下)双扩展指数值集中的元素,默认值是0。

浮点值集、浮点扩展指数值集、双精度值集、双精度扩展指数值集并不是类型。在JVM实现中,用浮点值集中的元素表示一个float类型的值,但是在某些特定的上下文中,也可以使用浮点扩展指数集中的元素来代替。同样,JVM的实现用双精度值集中的元素表示一个double类型的值,在特定上下文中也可以用双精度扩展指数值集来代替。

float和double在概念上与32位单精度、64位双精度格式的IEEE 754值和操作相关联,这是在IEEE二进制浮点算术标准(ANSI/IEEE Std. 754-1985, New York)中指定的。该标准不仅包括正负符号数量级,还包括正负零、正负无穷大和特殊的Not-a-Number值(简称NaN),NaN值用于表示某些无效操作(比如0除以0)的结果。

扩展知识:浮点类型与IEEE 754标准
每种JVM实现都需要支持两套标准的浮点值,分别是浮点值集和双精度值集。此外,作为可选项,JVM实现可以支持两种扩展指数浮点值集(extended-exponent floating-point value sets)中的一个或者两个,分别是浮点扩展指数值集(float extended-exponent value set)和双扩展指数值集(double-extended-exponent value set)。在某些情况下,它们用于代替标准值集类表示类型为float或double的值。
任何浮点值集中的有限非零值都可以用以下形式表示:
​,s是+1或-1,m是小于2N的正整数,e是​
之间的整数,
​,
​。

N和K的取值依赖于具体的值集。在以上表示形式中,有些值可以用多种方式表示。举个例子:假设有一个值集中的值v,s、m、e等于某些具体值时,v就可以用以上公式表示。如果m碰巧是偶数,而且e小于等于
,我们则可以将m减半,并将e加1,产生v的另外一种展现形式。

如果m≥2(N-1),则这种展现被称为是规范化的(normalized:规范化、归一化、标准化),否则就是非规范化的(denormalized)。如果值集中的一个值不能在m≥2N-1的情况下被表示,那么这个值就是一个非规范化的值。
对于两个必需的和两个可选浮点值集,参数N和K(以及派生参数Emin和Emax)的约束条件如下:

6777534ffdce4e92928bd58963aedd10.png
N和K(以及派生参数Emin和Emax)的约束条件)
当一个JVM实现支持一个或两个可扩展指数值集时,则每个被支持的可扩展指数值集都有一个特定的与实现相关的常数K,K的值满足以上约束,K派生出​和​的值。
四个值集中的每一个都不仅包括有限非零值,还包括另外五个值:正零、负零、正无穷、负无穷和NaN。
在约束设计中,每一个浮点值集的元素也是浮点扩展指数值集中的元素,每一个双精度值集的元素也是双精度扩展指数值集中的元素。每个扩展指数值集都比其对应的标准值集拥有更大的取值范围,但并没有更大的精度。
JVM规范中浮点值集的元素正是可以用IEEE 754标准所定义的单浮点格式表示的值,除此之外JVM的浮点值集中只有一个NaN值(IEEE 754标准指定了​个不同的NaN值)。JVM规范中双精度扩展指数值集的元素也正是可以用IEEE 754标准所定义的双浮点格式表示的值,同时也只有一个NaN值(IEEE 754标准指定了​个不同的NaN值)。
JVM规范中浮点扩展指数值集和双扩展指数值集的元素值,可以不与IEEE 754 单扩展和双扩展格式表示的值各自对应。JVM规范并不要求浮点值集中的值有特定的表示形式,除非我们要在class文件中表示一个浮点值。
你可以简单的总结为: JVM规范中的值集元素遵循IEEE 754标准里的表示形式,但不同的是,JVM规范中只有一个NaN值,而IEEE 754标准中有多个不同的NaN值。

浮点值的顺序
除了NaN,浮点值集的值是有序的。从小到大依次是负无穷、负有限值、正零和负零、正有限值和正无穷。
浮点正零和浮点负零是相等的,但通过其它操作可以区分它们。例如:0除以0等于正无穷,而0除以-0等于负无穷。
NaN是无序的,在数值等式的比较中,如果有一个或者两个数都是NaN,则结果为false。当且仅当值为NaN时,值与本身相比结果为false。在数值不等式中,如果有一个值是NaN,则对不等式结果为true。总结一句话:NaN跟谁都不相等。

returnAddress类型
returnAddress类型由JVM的jsr、ret和jsr_w指令使用,其值是指向JVM指令操作码的指针。与基本类型不同,returnAddress类型与Java编程语言类型没有直接关联。

布尔类型
虽然JVM定义了布尔类型,但是却没有专门针对布尔值操作的JVM指令。Java编程语言中操作布尔值的表达式会被编译为操作JVM int数据类型值,JVM使用1表示true,0表示false。
JVM直接支持了布尔数组,使用newarray指令创建布尔数组,使用字节数组指令baload和bastore访问和修改布尔类型数组。
在Oracle的JVM实现中,Java编程语言中的布尔数组会被编码为JVM字节数组,每一个布尔元素使用8个bit位。


引用类型
引用类型分为三种:类、数组、接口。它们的值是引用,分别指向动态创建的类实例、数组、实现接口的类实例或者数组。
引用也可以是特殊的空引用,指向一个空对象,空对象用null表示。空引用在初始化时是没有运行时类型的,可以被转换为任意类型。
引用类型的默认值是null。


术语百科二补整数(二进制补码整数)
计算机中的有符号数有三种表示方法,即:原码、反码和补码,三种表示方法均有符号位和数值位两部分。符号位用0表示正,用1表示负。而数值位,三种表示方法各有不同。
在计算机系统中,数值一律用补码来表示和存储。原因在于:使用补码可以将符号位和数值域统一处理,同时,加法与减法也可以统一处理。基本多文种平面
BMP(Basic MultiMultilingual Plane),或称第零平面(Plane 0),是Unicode中的一个编码区段,编码从U+0000到U+FFFF。

110cceab4bc1fc2d51aec55d06764c3f.gif
基本多文种平面


每个写着数字的格子自代表256个码点。

Oracle官方文档《The Java® Virtual Machine Specification》​docs.oracle.com
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值