Java中的数据类型可大致分为基本数据类型和引用数据类型,(下图是Java数据类型图示),今天介绍一下Java中的基本数据类型
1.整数类型:byte、short、int、long
-
Java各整数类型有固定的表数范围和字段长度,不受具体OS的影响,以保证java程序的可移植性。
-
java的整型常量默认为 int 型,声明long型常量须后加‘l’或‘L’
-
java程序中声明数值类型变量通常声明为int型,除非不足以表示较大的数,才使用long
类 型 | 占用存储空间 | 表数范围 |
byte | 1字节 = 8bit位 | -128~127 |
short | 2字节 | -2 15 ~215 -1 |
int | 4字节 | -2 31 ~ 231 -1 (约21亿) |
Long | 8字节 | -2 63 ~ 263 -1 |
2.浮点类型:float、double
与整数类型类似,Java 浮点类型也有固定的表数范围和字段长度,不受具体操作系统的影响。
2.1浮点型常量有两种表示形式:
十进制数形式:如:5.12 512.0f .512 (必须有小数点)
科学计数法形式:如:5.12e2 512E2 100E-2
float:单精度,尾数可以精确到7位有效数字。很多情况下,精度很难满足需求。
double:双精度,精度是float的两倍。通常采用此类型。
Java 的浮点型常量默认为double型,声明float型常量,须后加‘f’或‘F’。
类型 | 占用存储空间 | 表数范围 |
---|---|---|
单精度float | 4字节 | -3.403E38~3.403E38 |
双精度double | 8字节 | -1.798E308~1.798E308 |
3.字符类型:char
char 型数据用来表示通常意义上“字符”(2字节)
Java中的所有字符都使用Unicode编码,故一个字符可以存储一个字母,一个汉字,或其他书面语的一个字符。
3.1字符型变量的三种表现形式:
3.1.1单引号表示 ''
字符常量是用单引号(‘ ’)括起来的单个字符。例如:char c1 = 'a'; char c2 = '中'; char c3 = '9';
3.1.2转义字符
Java中还允许使用转义字符‘\’来将其后的字符转变为特殊字符型常量。
例如:char c3 = ‘\n’; '\n'表示换行符
3.1.3直接使用Unicode数值表示
直接使用 Unicode 值来表示字符型常量:‘\uXXXX’。其中,XXXX代表一个十六进制整数。如:\u000a 表示 \n。
char类型是可以进行运算的。因为它都对应有Unicode码
3.1.4一些常用的转义字符
转义字符 | 说明 |
---|---|
\b | 退格符 |
\n | 换行符 |
\r | 回车符 |
\t | 制表符 |
\" | 双引号 |
\' | 单引号 |
\\ | 反斜线 |
4.布尔类型:boolean
4.1boolean 类型用来判断逻辑条件,一般用于程序流程控制:
-
if条件控制语句;
-
while循环控制语句;
-
do-while循环控制语句;
-
for循环控制语句;
4.2注意事项
4.2.1 boolean类型数据只允许取值true和false,无null。
4.2.2 不可以使用0或非 0 的整数替代false和true,这点和C语言不同。
4.2.3 Java虚拟机中没有任何供boolean值专用的字节码指令,Java语言表达所操作的boolean值,在编译之后都使用java虚拟机中的int数据类型来代替:true用1表示,false用0表示。———《java虚拟机规范 8版》
5.了解:ASCII码
5.1二进制
在计算机内部,所有数据都使用二进制表示。每一个二进制位(bit)有 0 和 1 两种状态,
因此 8 个二进制位就可以组合出 256 种状态,这被称为一个字节(byte)。一个字节一
共可以用来表示 256 种不同的状态,每一个状态对应一个符号,就是 256 个符号,从
0000000 到 11111111。
5.2 ASCII码:
上个世纪60年代,美国制定了一套字符编码,对英语字符与二进制位之间的
关系,做了统一规定。这被称为ASCII码。ASCII码一共规定了128个字符的编码,比如
空格“SPACE”是32(二进制00100000),大写的字母A是65(二进制01000001)。这
128个符号(包括32个不能打印出来的控制符号),只占用了一个字节的后面7位,最前
面的1位统一规定为0。
5.3缺点:
不能表示所有字符。
相同的编码表示的字符不一样:比如,130在法语编码中代表了é,在希伯来语编码中却代表(ג) 了字母Gim
6.了解: Unicode 编码
6.1乱码:
世界上存在着多种编码方式,同一个二进制数字可以被解释成不同的符号。因
此,要想打开一个文本文件,就必须知道它的编码方式,否则用错误的编码方式解读,
就会出现乱码。
6.2Unicode:
一种编码,将世界上所有的符号都纳入其中。每一个符号都给予一个独一无二的编码,使用 Unicode 没有乱码的问题。
6.3Unicode 的缺点:
Unicode 只规定了符号的二进制代码,却没有规定这个二进制代码应该如何存储:无法区别 Unicode 和ASCII:计算机无法区分三个字节表示一个符号还是分别表示三个符号。另外,我们知道,英文字母只用一个字节表示就够了,如果unicode统一规定,每个符号用三个或四个字节表示,那么每个英文字母前都必然有二到三个字节是0这对于存储空间来说是极大的浪费
6.4了解: UTF-8
UTF-8 是在互联网上使用最广的一种 Unicode 的实现方式。
UTF-8 是一种变长的编码方式。它可以使用 1-6 个字节表示一个符号,根据不同的符号而变化字节长度。
6.5UTF-8的编码规则:
对于单字节的UTF-8编码,该字节的最高位为0,其余7位用来对字符进行编码(等同于ASCII码)。
对于多字节的UTF-8编码,如果编码包含 n 个字节,那么第一个字节的前 n 位为1,第一个字节的第 n+1 位为0,该字节的剩余各位用来对字符进行编码。在第一个字节之后的所有的字节,都是最高两位为"10",其余6位用来对字符进行编码。