变量概述
- 概念:
- 内存中的一个存储区域
- 该区域的数据可以在同一类型范围内不断变化
- 变量是程序中最基本的存储单元,包含变量类型、变量名和存储值
- 作用
- 用于在内存中保存数据
变量的使用
- java定义变量的格式:数据类型 变量名 = 变量值
- Java中每个变量必须先声明,后使用
- 使用变量名来访问这块区域的数据
- 变量的作用域:其定义所在的一对{ }内
- 变量只有在其作用域内才有效
- 同一个作用域内,不能定义重名的变量
eg:
class VariableTest{
public static void main(String[] args){
//变量的定义
int myAge = 12;
//变量的使用
System.out.println(myAge);
//编译错误:使用myNumber之前并未定义过myNumber
//System.out.println(myNumber);
//变量的声明
int myNumber;
//编译错误:使用myNumber之前并未赋值过myNumber
//System.out.println(myNumber);
//变量的赋值
myNumber = 1001;
System.out.println(myNumber);
//编译错误:变量只有在其作用域内才有效
//System.out.println(myClass);
//不可以在同一个作用域内定义同名的变量
//int myAge =22;
}
public void method(){
int myClass = 1;
}
}
变量的分类-按数据类型
基本数据类型使用
整数类型:byte,short,int,long
- Java各整数类型有固定的表数范围和字段长度,不受具体OS的影响,以保证java程序的可移植性。
- java的整型常量默认为 int 型,声明long型常量须后加 ‘l’或‘L’
- java程序中变量通常声明为int型,除非不足以表示较大的数,才使用long
浮点类型:float,double
- 与整数类型类似,Java 浮点类型也有固定的表数范围和字段长度,不受具体操作系统的影响。
- En代表10的幂次方
- float:单精度,尾数可以精确到7位有效数字。很多情况下,精度很难满足需求。
- double:双精度,精度是float的两倍。通常采用此类型。
- Java 的浮点型常量默认为double型,声明float型常量,须后加 ‘f’或‘F’
字符类型:char
- char 型数据用来表示通常意义上“字符”(2字节)
- Java中的所有字符都使用Unicode编码,故一个字符可以存储一个字母,一个汉字,或其他书面语的一个字符。
- Java中还允许使用转义字符‘\’来将其后的字符转变为特殊字符型常量。例如:char c3 = ‘\n’; // '\n’表示换行符。
转义字符 | 说明 |
---|---|
\b | 退格符 |
\n | 换行符 |
\r | 回车符 |
\t | 制表符 |
\’’ | 双引号 |
\’ | 单引号 |
\\ | 反斜线 |
- 直接使用 Unicode 值来表示字符型常量:‘\uXXXX’。其中,XXXX代表一个十六进制整数。如:\u000a 表示 \n。
本文最后附上关于乱码和字符集的简介
布尔型:boolean
- boolean 类型用来判断逻辑条件,一般用于程序流程控制:
- if条件控制语句;
- while循环控制语句;
- do-while循环控制语句;
- for循环控制语句; - boolean类型数据只允许取值 true和 false,无null。不可以使用0或非 0 的整数替代false和true,这点和C语言不同。
- Java虚拟机中没有任何供boolean值专用的字节码指令,Java语言表达所操作的boolean值,在编译之后都使用java虚拟机中的int数据类型来代替:true用1表示,false用0表示。———《java虚拟机规范 8版》
eg:
class VariableTest1{
public static void main(String[] args) {
//1 整型:
byte b1 = 12;
byte b2 = -128;
//编译错误:超过byte范围
//byte b3 = 128
System.out.println(b1);
System.out.println(b2);
//声明long型,必须以"l"或"L"结尾
short s1 = 128;
int i1 = 1234;
long l1 = 31124251L;
System.out.println(1);
//2 浮点型:
//浮点型表示带小数的数值
//float表示数值的范围比long还大
double d1 = 123.3;
System.out.println(d1+1);
//定义float类型变量时,使用double型。
float f1 = 12.3F;
System.out.println(f1);
//3 字符型:char
char c1 = 'a';//与char c1 = 97 意义相同(a的ASCII码是97),但这种方式很少使用。
c1 = 'A';
//编译错误:内部只能写一个字符
//c1 = 'AB'
char c2 = '1';
char c3 = '中';
char c4 = 'ス';
System.out.println(c2);
System.out.println(c3);
System.out.println(c4);
//转义字符
char c5 = '\n';//换行符
c5 = '\t';//制表符
System.out.print("hello"+ c5);
System.out.println("World");
char c6 = '\u0043';//CodeChart中对应的是C
System.out.println(c6);
//4 布尔型:Boolean
//只能取两个值之一:true,false
//常用在条件判断和循环结构。
boolean bb1 = true;
System.out.println(bb1);
boolean isMarried = true;
if(isMarried){
System.out.println("你就不能参加\"单身\"party了!\\n很遗憾!");//输出"",\n。
}else{
System.out.println("你可以多谈谈女朋友!");
}
}
}
附:乱码和字符集
ASCII 码
- 在计算机内部,所有数据都使用二进制表示。每一个二进制位(bit)有 0 和 1 两种状态, 因此 8 个二进制位就可以组合出256种状态,这被称为一个字节(byte)。一个字节一 共可以用来表示 256 种不同的状态,每一个状态对应一个符号,就是 256 个符号,从0000000 到 11111111。
- ASCII码:上个世纪60年代,美国制定了一套字符编码,对英语字符与二进制位之间的关系,做了统一规定。这被称为ASCII码。ASCII码一共规定了128个字符的编码,比如空格“SPACE”是32(二进制00100000),大写的字母A是65(二进制01000001)。这128个符号(包括32个不能打印出来的控制符号),只占用了一个字节的后面7位,最前面的1位统一规定为0。
- 缺点:
- 不能表示所有字符。
- 相同的编码表示的字符不一样:比如,130在法语编码中代表了é,在希伯来语编码中却代表 (ג) 了字母Gimel
Unicode 编码
- 乱码:世界上存在着多种编码方式,同一个二进制数字可以被解释成不同的符号。因此,要想打开一个文本文件,就必须知道它的编码方式,否则用错误的编码方式解读, 就会出现乱码。
- Unicode:一种编码,将世界上所有的符号都纳入其中。每一个符号都给予一个独一 无二的编码,使用 Unicode 没有乱码的问题。
- Unicode 的缺点:Unicode 只规定了符号的二进制代码,却没有规定这个二进制代码应该如何存储:无法区别 Unicode 和ASCII:计算机无法区分三个字节表示一个符号 还是分别表示三个符号。另外,我们知道,英文字母只用一个字节表示就够了,如果unicode统一规定,每个符号用三个或四个字节表示,那么每个英文字母前都必然有 二到三个字节是0,这对于存储空间来说是极大的浪费。
UTF-8
- UTF-8 是在互联网上使用最广的一种 Unicode 的实现方式。
- UTF-8 是一种变长的编码方式。它可以使用 1-6个字节表示一个符号,根据 不同的符号而变化字节长度。
- UTF-8的编码规则:
- 对于单字节的UTF-8编码,该字节的最高位为0,其余7位用来对字符进行编码(等同于 ASCII码)。
- 对于多字节的UTF-8编码,如果编码包含 n 个字节,那么第一个字节的前 n 位为1,第一 个字节的第 n+1位为0,该字节的剩余各位用来对字符进行编码。在第一个字节之后的 所有的字节,都是最高两位为"10",其余6位用来对字符进行编码。
eg:
class CharacterDemo
{
public static void main(String[] args)
{
System.out.println("Hello World!你好,中国!");
}
}
先保存为UTF-8文件:
执行结果:
出现乱码。这是因为命令行默认以GBK解析,我保存时用的UTF-8,所以出现乱码。如何避免出现乱码,就必须使写 和读的时候用同一个字符集。
重新保存为ANSI(ANSI在中文操作系统下代表只识别中文,相当于GBK)
再运行
本章完结!