第一章 Java基本语法(上)变量与运算符
1. 关键字
2. 标识符
-
Java 中变量、方法、类等要素命名时使用的字符序列,称为标识符。
技巧:凡是自己可以起名字的地方都叫标识符。
标识符的命名规则(必须遵守的硬性规定):
> 由 26 个英文字母大小写, 0-9 , _或 $ 组成
> 数字不可以开头。
> 不可以使用关键字和保留字,但能包含关键字和保留字。
> Java 中严格区分大小写,长度无限制。
> 标识符不能包含空格。
标识符的命名规范(建议遵守的软性要求,否则工作时容易被鄙视) :
> 包名:多单词组成时所有字母都小写: xxxyyyzzz。
例如: java.lang、 com.atguigu.bean
> 类名、接口名:多单词组成时,所有单词的首字母大写: XxxYyyZzz
例如: HelloWorld, String, System 等
> 变量名、方法名:多单词组成时,第一个单词首字母小写,第二个单词开始每个单
词首字母大写: xxxYyyZzz
例如: age,name,bookName,main,binarySearch,getName
> 常量名:所有字母都大写。多单词时每个单词用下划线连接: XXX_YYY_ZZZ
例如: MAX_VALUE,PI,DEFAULT_CAPACITY
注意:在起名字时,为了提高阅读性,要尽量有意义, “见名知意”。
3. 变量
3.1 变量的概念
- 内存中的一个存储区域,该区域的数据可以在同一类型范围内不断变化
- 变量的构成包含三个要素: 数据类型、 变量名、 存储的值
- ava 中变量声明的格式: 数据类型 变量名 = 变量值
- 变量的作用: 用于在内存中保存数据。
3.2 变量使用时的注意点
- Java 中每个变量必须先声明,后使用。
- 使用变量名来访问这块区域的数据。
- 变量的作用域:其定义所在的一对{ }内。
- 变量只有在其作用域内才有效。出了作用域,变量不可以再被调用。
- 同一个作用域内,不能定义重名的变量。
3.3 变量的分类
Java 中变量的数据类型分为两大类 :
基本数据类型:包括 整数类型、 浮点数类型、 字符类型、 布尔类型。
引用数据类型:包括数组、 类、 接口、 枚举、 注解、 记录。
3.4 变量的使用步骤
步骤1:变量的声明
- 格式:数据类型 变量名;
- 注意:变量的数据类型可以是基本数据类型,也可以是引用数据类型。
步骤 2:变量的赋值
给变量赋值,就是把“值”存到该变量代表的内存空间中。同时,给变量赋的值类型必须与变量声明的类型一致或兼容。
格式: 变量名 = 值;
变量的内存结构如图:
4. 基本数据类型介绍
4.1 整数类型:byte,short,int,long
- 定义 long 类型的变量,赋值时需要以"l"或"L"作为后缀。
- Java 程序中变量通常声明为 int 型,除非不足以表示较大的数,才使用 long。
- Java 的整型常量默认为 int 型
4.2 浮点类型: float、 double
浮点型常量有两种表示形式:
– 十进制数形式。如: 5.12 512.0f .512 (必须有小数点)
– 科学计数法形式。如: 5.12e2 512E2 100E-2
- float: 单精度,尾数可以精确到 7 位有效数字。很多情况下,精度很难满足需求。
- double: 双精度,精度是 float 的两倍。通常采用此类型。
- 定义 float 类型的变量,赋值时需要以"f"或"F"作为后缀。
- Java 的浮点型常量默认为 double 型。
4.2.1 关于浮点型精度的说明
-
并不是所有的小数都能可以精确的用二进制浮点数表示。二进制浮点数不能精确的表示 0.1、 0.01、 0.001 这样 10 的负次幂。
-
浮点类型 float、 double 的数据不适合在不容许舍入误差的金融计算领域。如果需要精确数字计算或保留指定位数的精度,需要使用 BigDecimal 类
-
0.1 + 0.2 不等于 0.3
System.out.println(0.1 + 0.2);//0.30000000000000004
4.3 字符类型: char
- char 型数据用来表示通常意义上“字符”(占 2 字节)
- Java 中的所有字符都使用 Unicode 编码,故一个字符可以存储一个字母,一个汉字,或其他书面语的一个字符。
转义字符:
转义字符 说明 Unicode 表示方式 \n 换行符 \u000a \t 制表符 \u0009 \" 双引号 \u0022 \’ 单引号 \u0027 \\ 反斜线 \u005c \b 退格符 \u0008 \r 回车符 \u000d
- char 类型是可以进行运算的。因为它都对应有 Unicode 码,可以看做是一个数值。
4.4 布尔类型: boolean
-
boolean 类型用来判断逻辑条件,一般用于流程控制语句中:
- if 条件控制语句;
- while 循环控制语句;
- for 循环控制语句;
- do-while 循环控制语句;
-
boolean 类型数据只有两个值: true、 false,无其它
- 不可以使用 0 或非 0 的整数替代 false 和 true,这点和 C 语言不同。
- 拓展: Java 虚拟机中没有任何供 boolean 值专用的字节码指令, Java 语言表达所操作的 boolean 值,在编译之后都使用 java 虚拟机中的 int 数据类 型来代替: true 用 1 表示, false 用 0 表示。 ——《java 虚拟机规范 8 版》
5. 基本数据类型变量间运算规则
Java的基本数据类型经常发生转换,转换的方式有两种:自动类型提升和强制类型转换。
5.1 自动类型提升
- 规则:将取值范围小(或容量小)的类型自动提升为取值范围大(或容量大)的类型 。
5.2 强制类型转换
- 规则:将取值范围大(或容量大)的类型强制转换成取值范围小(或容量小)的类型。
- 转换格式: 数据类型 1 变量名 = (数据类型 1)被强转数据值; //()中的数据类型必须<=变量值
的数据类型
5.3 基本数据类型与String的运算
5.3.1 字符串类型:String
String 不是基本数据类型,属于引用数据类型
使用一对""来表示一个字符串,内部可以包含 0 个、 1 个或多个字符。
声明方式与基本数据类型类似。例如: String str = “Java”;
5.3.2 运算规则
- 任意八种基本数据类型的数据与 String 类型只能进行连接“+”运算,且结果一定也是 String 类型
- String 类型不能通过强制类型()转换,转为其他的类型
6. 运算符
运算符是一种特殊的符号,用以表示数据的运算、赋值和比较等 。
运算符的分类:
- 按照功能分类:
- 按操作数个数分类为:
6.1 算术运算符
6.2 赋值运算符
6.3 逻辑运算符
运算符说明:
- & 和 &&:表示"且"关系,当符号左右两边布尔值都是 true 时,结果才能为 true。否则,为 false。
- | 和 || :表示"或"关系,当符号两边布尔值有一边为 true 时,结果为true。当两边都为 false 时,结果为 false
- ! :表示"非"关系,当变量布尔值为 true 时,结果为 false。当变量布尔值为 false 时,结果为 true。
- ^ :当符号左右两边布尔值不同时,结果为 true。当两边布尔值相同时,结果为 false 【异或】
区分“&”和“&&”:
-
相同点:如果符号左边是 true,则二者都执行符号右边的操作
-
不同点: & : 如果符号左边是 false,则继续执行符号右边的操作
&& :如果符号左边是 false,则不再继续执行符号右边的操作
-
建议:开发中,推荐使用 &&
区分“|”和“||”:
-
相同点:如果符号左边是 false,则二者都执行符号右边的操作
-
不同点: | : 如果符号左边是 true,则继续执行符号右边的操作
|| :如果符号左边是 true,则不再继续执行符号右边的操作
-
建议:开发中,推荐使用 ||
代码说明:
public class LoginTest {
public static void main(String[] args) {
int a = 3;
int b = 4;
int c = 5;
//&和&&的区别
System.out.println((a > b) & (a++ > c));
System.out.println("a = " + a);
System.out.println((a > b) && (a++ > c));
System.out.println("a = " + a);
System.out.println((a == b) && (a++ > c));
System.out.println("a = " + a);
//|和||的区别
System.out.println((a > b) | (a++ > c));
System.out.println("a = " + a);
System.out.println((a > b) || (a++ > c));
System.out.println("a = " + a);
System.out.println((a == b) || (a++ > c));
System.out.println("a = " + a);
}
}
6.4 位运算符
6.5 条件运算符
条件运算符格式:
(条件表达式)? 表达式 1:表达式 2
说明:条件表达式是 boolean 类型的结果,根据 boolean 的值选择表达式 1 或表达式 2
7. 【扩展】关于字符集
7.1 字符集
编码与解码:
计算机中储存的信息都是用二进制数表示的,而我们在屏幕上看到的数字、英文、标点符号、汉字等字符是二进制数转换之后的结果。按照某种规则,将字符存储到计算机中,称为编码 。反之,将存储在计算机中的二进制数按照某种规则解析显示出来,称为解码 。
字符编码 : 就是一套自然语言的字符与二进制数之间的对应规则。
字符集 : 也叫编码表。是一个系统支持的所有字符的集合,包括各国家文字、标点符号、图形符号、数字等。
7.2 ASCII 码
ASCII 码(American Standard Code for Information Interchange,美国信息交换标准代
码):上个世纪 60 年代,美国制定了一套字符编码,对英语字符与二进制位之间的关
系,做了统一规定。这被称为 ASCII 码。
ASCII 码用于显示现代英语,主要包括控制字符(回车键、退格、换行键等)和可显示
字符(英文大小写字符、阿拉伯数字和西文符号)。
基本的 ASCII 字符集,使用 7 位(bits)表示一个字符(最前面的 1 位统一规定为 0),
共 128 个字符。比如:空格“SPACE”是 32(二进制 00100000),大写的字母 A 是 65
(二进制 01000001)。
缺点:不能表示所有字符。[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-dz5QJ3m6-1681820430774)(img/1681820222687.png)]
7.3 ISO-8859-1 字符集
拉丁码表,别名 Latin-1,用于显示欧洲使用的语言,包括荷兰语、德语、意大利语、葡
萄牙语等
ISO-8859-1 使用单字节编码,兼容 ASCII 编码。
7.4 GBxxx 字符集
GB 就是国标的意思,是为了显示中文而设计的一套字符集。
GB2312:简体中文码表。一个小于 127 的字符的意义与原来相同,即向下兼容 ASCII
码。但两个大于 127 的字符连在一起时,就表示一个汉字,这样大约可以组合了包含
7000 多个简体汉字,此外数学符号、罗马希腊的字母、日文的假名们都编进去了,这
就是常说的"全角"字符,而原来在 127 号以下的那些符号就叫"半角"字符了。
GBK:最常用的中文码表。是在 GB2312 标准基础上的扩展规范,使用了双字节编码方
案,共收录了 21003 个汉字,完全兼容 GB2312 标准,同时支持繁体汉字以及日韩汉
字等。
GB18030:最新的中文码表。收录汉字 70244 个,采用多字节编码,每个字可以由 1
个、 2 个或 4 个字节组成。支持中国国内少数民族的文字,同时支持繁体汉字以及日韩
汉字等。
7.5 Unicode 码
Unicode 编码为表达任意语言的任意字符而设计,也称为统一码、标准万国码。
Unicode 将世界上所有的文字用 2 个字节统一进行编码,为每个字符设定唯一的二进制
编码,以满足跨语言、跨平台进行文本处理的要求。
Unicode 的缺点:这里有三个问题:
– 第一,英文字母只用一个字节表示就够了,如果用更多的字节存储是极大
的浪费。
– 第二,如何才能区别 Unicode 和 ASCII?计算机怎么知道两个字节表示
一个符号,而不是分别表示两个符号呢?
– 第三,如果和 GBK 等双字节编码方式一样,用最高位是 1 或 0 表示两个字
节和一个字节,就少了很多值无法用于表示字符, 不够表示所有字符。
Unicode 在很长一段时间内无法推广,直到互联网的出现,为解决 Unicode 如何在网络
上传输的问题,于是面向传输的众多 UTF(UCS Transfer Format)标准出现。具体来
说,有三种编码方案, UTF-8、 UTF-16 和 UTF-32。
7.6 UTF-8
Unicode 是字符集, UTF-8、 UTF-16、 UTF-32 是三种将数字转换到程序数据的编码方
案。顾名思义, UTF-8 就是每次 8 个位传输数据,而 UTF-16 就是每次 16 个位。其中,
UTF-8 是在互联网上使用最广的一种 Unicode 的实现方式。
互联网工程工作小组(IETF)要求所有互联网协议都必须支持 UTF-8 编码。所以,我们
开发 Web 应用,也要使用 UTF-8 编码。 UTF-8 是一种变长的编码方式。它可以使用
1-4 个字节表示一个符号它使用一至四个字节为每个字符编码,编码规则:
- 128 个 US-ASCII 字符,只需一个字节编码。
- 拉丁文等字符,需要二个字节编码。
- 大部分常用字(含中文),使用三个字节编码。
- 其他极少使用的 Unicode 辅助字符,使用四字节编码。