Java核心技术卷1——每日笔记

最新推荐文章于 2024-03-30 21:30:52 发布

阿常11

最新推荐文章于 2024-03-30 21:30:52 发布

阅读量1k

点赞数 14

文章标签： java 笔记 python

本文链接：https://blog.csdn.net/weixin_72939806/article/details/136404538

版权

第3章 Java的基本程序设计结构

文档注释法：

/**
 *  注释内容
 *
 *
 *
 */

java有8种基本类型，四个整型（int 、short、long、byte）、两种浮点类型（float、double）、1种字符类型char（用于表示Unicode编码的代码单元）和一种表示真值的boolean类型。

长整数整型后缀 L 或 l ，十六进制数值前缀 0x 或 0X ，八进制数值前缀0，很显然八进制很容易混淆所以最好不要使用八进制常数。

二进制前缀0b或0B。并且可以为数字字面量加下划线，如1_000_000，java编译器会自动去除这些下划线。
java没有任何无符号（unsigned）形式的int、long、short或byte类型。
若要进行无符号运算，可调用Byte.toUnsignedInt(b)来得到一个0到255的int值，实现无符号的效果，最终再转化为byte即可。

并且在Integer和Long类种都提供了处理无符号除法和求余数的方法。

各个国家拥有不同的字符编码机制，产生了两个问题：

一是对于任意给定的代码值，在不同的编码方案有可能对应不同的字母。

二是采用大字的语言其编码长度有可能不同。
而设计Unicode编码的目的就是要解决这些问题。

现在16位的char类型以及不能满足所有Unicode字符的需要了。

下面利用一些专用术语来解释Java语言从Java5开始如何解释这个问题。

码点（codepoint）是指一个编码表中的某个字符对应的代码值。
在Unicode标准中，码点采用十六进制书写，并加上前缀U+，例如U+0041就是拉丁字母的码点。
Unicode的码点可以分为17个代码平面（code plane）。

第一个代码平面成为基本多语言平面（basic multilingual pane），包括码点从U+0000到U+FFFF的“经典”Unicode代码；

其余的16个平面的码点从U+10000到U+10FFFF，包括辅助字符（supplementary character）。
UTF-16编码采用不同长度的编码表示所有Unicode码点。

在基本多语言平面中，每个字符用16位表示，成为代码单元（code unit）；

而辅助字符编码为一对连续的代码单元。

采用这种编码对表示的各个值落入基本多语言平面中未用的2048个值范围内，通常成为替代区域（surrogate area）

（U+D800~U+DBFF 用于第一个代码单元，U+DC00~U+DFFF用于第二个代码单元）。

这样的设计，使得我们可以从中迅速知道一个代码单元是一个字符的编码，还是一个辅助字符的第一或第二部分。
在Java中，char类型描述了UTF-16编码中的一个代码单元。
我们强烈建议不要在程序中使用char类型，除非确实需要UTF-16代码单元。

最好将字符串作为抽象数据类型处理。

关注