JDK8源码阅读（六） java.lang.String

最新推荐文章于 2024-09-10 15:12:14 发布

请叫我猿叔叔

最新推荐文章于 2024-09-10 15:12:14 发布

阅读量1k

点赞数

分类专栏： JDK源码文章标签： String jdk jdk8 源码 java

本文链接：https://blog.csdn.net/qq_35206261/article/details/88570109

版权

JDK源码专栏收录该内容

20 篇文章 3 订阅

订阅专栏

一、类

1.1 类修饰符

A. string类表示字符串。Java程序中的所有字符串文字，如“ABC”，都是作为该类的实例实现的。字符串是常量；它们的值在创建后不能更改。字符串缓冲区支持可变字符串。因为字符串对象是不可变的，所以可以共享它们;

B. 类字符串包括检查序列中单个字符、比较字符串、搜索字符串、提取子字符串以及创建字符串副本（所有字符都转换为大写或小写）的方法。大小写映射基于字符类指定的Unicode标准版本;

C. Java语言为字符串级联操作符（+）提供了特殊的支持，并将其他对象转换为字符串。字符串连接是通过StringBuilder（或StringBuffer）类及其append方法实现的。字符串转换是通过对象ToString实现的，由对象定义并由Java中的所有类继承。有关字符串连接和转换的附加信息，请参见Java语言规范戈斯林、Joy和斯梯尔;

D. 除非另有说明，否则将空参数传递给此类中的构造函数或方法将导致引发NullPointerException;

E. 字符串表示采用UTF-16格式的字符串，其中补充字符由代理项对表示（有关详细信息，请参阅字符类中的Unicode字符表示部分）。索引值指的是字符代码单位，因此补充字符在字符串中使用两个位置;

F. 字符串类除了提供处理Unicode代码单元（即char值）的方法外，还提供了处理Unicode代码点（即字符）的方法;

G. String str = "abc"; 和 char data[] = {'a', 'b', 'c'}; String str = new String(data); 是相等的。

1.2 类结构图

二、内部类

2.1 CaseInsensitiveComparator

具体参见链接TODO

三、字段

3.1 字段列表

3.2 字段修饰符

3.3 字段详解

3.3.1 serialVersionUID

A. 使用JDK 1.0.2中的serialVersionUID实现互操作性;

3.3.2 hash

A. 缓存字符串的哈希码, 默认为0;

3.3.3 value[]

A. 该值用于字符存储;

3.3.4 serialPersistentFields

A. 类字符串在序列化流协议中是特殊情况。根据对象序列化规范第6.2节“流元素”，将字符串实例写入ObjectOutputStream;

3.3.5 CASE_INSENSITIVE_ORDER

A. 按CompareToIgnoreCase对字符串对象排序的比较器。这个比较器是可序列化的。请注意，这个比较器不考虑区域设置，并且会导致某些区域设置的排序不令人满意。java.text包提供了排序器，允许区分区域设置的排序;

四、方法

4.1 方法列表

注：如上图，共有n个方法。

绿色打开的锁代表是public, 红色关闭的代表是private, 灰色的钥匙代表的protected。

4.2 方法修饰符

4.3 方法详解

4.3.0 代码块

无。

4.3.1 构造函数

4.3.1.1 String()

A. 初始化新创建的字符串对象，使其表示空字符序列。

B. 注意，不需要使用此构造函数，因为字符串是不可变的。

4.3.1.2 String(String original)

A. 初始化新创建的字符串对象，使其表示与参数相同的字符序列；

B. 换句话说，新创建的字符串是参数字符串的副本。除非需要原始的显式副本，否则不必使用此构造函数，因为字符串是不可变的。

4.3.1.3 String(char value[])

A. 分配一个新字符串，以便它表示当前包含在字符数组参数中的字符序列。复制字符数组的内容；随后对字符数组的修改不会影响新创建的字符串。

B. 该方法调用java.util.Arrays的copyOf方法，复制指定的数组，截断或填充空字符（如有必要），使副本具有指定的长度。对于在原始数组和副本中都有效的所有索引，这两个数组将包含相同的值。对于副本中有效但不是原始索引的任何索引，副本将包含'\u000'。只有当指定的长度大于原始数组的长度时，才会存在此类索引。在此处该方法内部大致逻辑如下：根据原始字符数组的长度创建一个新的字符数组，然后调用java.lang.System的arraycopy方法，将原始数组、新的字符数组、长度传递过去。

C. 该方法是一个native方法，不是java实现。大致操作为：从指定的源数组（从指定位置开始）将数组复制到目标数组的指定位置。数组组件的子序列从SRC引用的源数组复制到DEST引用的目标数组。复制的组件数等于长度参数。源数组中位置srcpos到srcpos+length-1的组件分别通过目标数组的destpos+length-1复制到位置destpos。

4.3.1.4 String(char value[], int offset, int count)

A. 分配包含字符数组参数子数组中的字符的新字符串。offset参数是子数组第一个字符的索引，count参数指定子数组的长度。子数组的内容将被复制；随后对字符数组的修改不会影响新创建的字符串。

B. 该方法的大致内容如下：如果偏移量和或长度小于零，则不合法；如果取的长度等于零，则将原始字符数组改为空串的字符数组并返回；如果偏移量和截取长度之和大于字符数组长度，则不合法；符合条件的情况下，调用java.util.Arrays的copyOfRange方法，将原始数组、偏移量、偏移量与长度之和传递过去。

C.将指定数组的指定范围复制到新数组中。范围（从）的初始索引必须介于0和original.length之间（包括0和original.length）。原始[From]处的值放入副本的初始元素中（除非From==Original.Length或From==To）。原始数组中后续元素的值将放置到副本中的后续元素中。范围（到）的最后一个索引必须大于或等于From，它可以大于original.length，在这种情况下，将在索引大于或等于original.length-From的副本的所有元素中放置'\u000'。返回的数组的长度将为至-自。最后调用java.lang.System的arraycopy方法。

4.3.1.5 String(int[] codePoints, int offset, int count) 【TODO】

A. 分配一个新字符串，该字符串包含来自unicode码位数组参数子数组的字符。offset参数是子数组第一个代码点的索引，count参数指定子数组的长度。子数组的内容转换为chars；对int数组的后续修改不会影响新创建的字符串。

B. 该方法的大致内容如下：如果偏移量和或长度小于零，则不合法；如果取的长度等于零，则将原始字符数组改为空串的字符数组并返回；如果偏移量和截取长度之和大于字符数组长度，则不合法；符合条件的情况下，TODO

4.3.1.6 String(byte ascii[], int hibyte, int offset, int count)[TODO]

A. 这是一个过时方法。分配从8位整数值数组的子数组构造的新字符串。offset参数是子数组第一个字节的索引，count参数指定子数组的长度。子数组中的每个字节都转换为上面方法中指定的字符。

B. 该方法的具体内容如下：TODO

4.3.1.7 String(byte ascii[], int hibyte) [TODO]

A. 分配包含从8位整数值数组构造的字符的新字符串。结果字符串中的每个字符都是由字节数组中相应的组件B构造的。TODO

4.3.1.8 String(byte bytes[], int offset, int length, String charsetName)[TODO]

A. 通过使用指定的字符集对指定的字节子数组进行解码来构造新的字符串。新字符串的长度是字符集的函数，因此可能不等于子数组的长度。

B. 未指定给定字符集中给定字节无效时此构造函数的行为。当需要对解码过程进行更多控制时，应使用java.nio.charset.charsetdecoder类。

4.3.1.9 String(byte bytes[], int offset, int length, Charset charset) [TODO]

A. 通过使用指定的字符集对指定的字节子数组进行解码来构造新的字符串。新字符串的长度是字符集的函数，因此可能不等于子数组的长度。

B. 此方法总是用此字符集的默认替换字符串替换格式错误的输入和不可映射的字符序列。当需要对解码过程进行更多控制时，应使用java.nio.charset.charsetdecoder类。

4.3.1.10 String(byte bytes[], String charsetName) [TODO]

A. 通过使用指定的字符集对指定的字节数组进行解码来构造新的字符串。新字符串的长度是字符集的函数，因此可能不等于字节数组的长度。

B. 未指定给定字符集中给定字节无效时此构造函数的行为。当需要对解码过程进行更多控制时，应使用java.nio.charset.charsetdecoder类。

4.3.1.11 String(byte bytes[], Charset charset) [TODO]

A. 通过使用指定的字符集对指定的字节数组进行解码来构造新的字符串。新字符串的长度是字符集的函数，因此可能不等于字节数组的长度。

4.3.1.12 String(byte bytes[], int offset, int length) [TODO]

A. 通过使用平台的默认字符集对指定的字节子数组进行解码来构造新的字符串。新字符串的长度是字符集的函数，因此可能不等于子数组的长度。

B. 未指定给定字节在默认字符集中无效时此构造函数的行为。当需要对解码过程进行更多控制时，应使用java.nio.charset.charsetdecoder类。

4.3.1.13 String(byte bytes[]) [TODO]

A. 通过使用平台的默认字符集对指定的字节数组进行解码来构造新的字符串。新字符串的长度是字符集的函数，因此可能不等于字节数组的长度。

B. 未指定给定字节在默认字符集中无效时此构造函数的行为。当需要对解码过程进行更多控制时，应使用java.nio.charset.charsetdecoder类。

4.3.1.14 String(StringBuffer buffer)

A. 这是一个同步方法。分配包含字符串缓冲区参数中当前包含的字符序列的新字符串。复制字符串缓冲区的内容；随后对字符串缓冲区的修改不会影响新创建的字符串。

B. 该方法的大致逻辑如下：以该StringBuffer对象作为锁，同步代码块中调用java.util.Arrays的copyOf方法，将StringBuffer的value和长度传递过去。

C. java.util.Arrays的copyOf方法的内部大致逻辑如下：复制指定的数组，截断或填充空字符（如有必要），使副本具有指定的长度。对于在原始数组和副本中都有效的所有索引，这两个数组将包含相同的值。对于副本中有效但不是原始索引的任何索引，副本将包含'\u000'。只有当指定的长度大于原始数组的长度时，才会存在此类索引。然后会调用java.lang.System的arraycopy方法，略。