String源码浅剖
本文基于JDK8,课程学习笔记
接口实现关系
public final class String
implements java.io.Serializable, Comparable<String>, CharSequence {
// char[]数组用于存储字符串的值
private final char value[];
// 缓存字符串的 hash code
private int hash; // Default to 0
// ......其他
}
- String是一个final类,既不能被继承的类
- String类实现了java.io.Serializable接口,可以实现序列化
- String类实现了Comparable,可以用于比较大小(按顺序比较单个字符的ASCII码)
- String类实现了 CharSequence 接口,表示是一个有序字符的序列,因为String的本质是一个char类型数组
几个较常用的构造方法
// String 为参数的构造方法
public String(String original) {
this.value = original.value;
this.hash = original.hash;
}
// char[] 为参数构造方法
public String(char value[]) {
this.value = Arrays.copyOf(value, value.length);
}
// StringBuffer 为参数的构造方法
public String(StringBuffer buffer) {
synchronized(buffer) {
this.value = Arrays.copyOf(buffer.getValue(), buffer.length());
}
}
// StringBuilder 为参数的构造方法
public String(StringBuilder builder) {
this.value = Arrays.copyOf(builder.getValue(), builder.length());
}
较常用的比较字符串方法
- equals
比较两个字符串是否相等
public boolean equals(Object anObject) {
// 对象引用相同直接返回 true
if (this == anObject) {
return true;
}
// 判断需要对比的值是否为 String 类型,如果不是则直接返回 false
// instanceof用于判断一个对象是否是某类的实例
if (anObject instanceof String) {
String anotherString = (String)anObject;
int n = value.length;
if (n == anotherString.value.length) {
// 把两个字符串都转换为 char 数组对比
char v1[] = value;
char v2[] = anotherString.value;
int i = 0;
// 循环比对两个字符串的每一个字符
while (n-- != 0) {
// 如果其中有一个字符不相等就 true false,否则继续对比
if (v1[i] != v2[i])
return false;
i++;
}
return true;
}
}
return false;
}
- compareTo
用于比较字符串是否一致,返回值为int型,0表示相等
public int compareTo(String anotherString) {
int len1 = value.length;
int len2 = anotherString.value.length;
// 获取到两个字符串长度最短的那个 int 值
int lim = Math.min(len1, len2);
char v1[] = value;
char v2[] = anotherString.value;
int k = 0;
// 对比每一个字符
while (k < lim) {
char c1 = v1[k];
char c2 = v2[k];
if (c1 != c2) {
// 有字符不相等就返回差值
return c1 - c2;
}
k++;
}
return len1 - len2;
}
- equals()和compareTo的区别:
- equals() 可以接收一个 Object 类型的参数,而 compareTo() 只能接收一个 String 类型的参数;
- equals() 返回值为 Boolean,而 compareTo() 的返回值则为 int。
其他方法
- indexOf():查询字符串首次出现的下标位置
- lastIndexOf():查询字符串最后出现的下标位置
- contains():查询字符串中是否包含另一个字符串
- toLowerCase():把字符串全部转换成小写
- toUpperCase():把字符串全部转换成大写
- length():查询字符串的长度
- trim():去掉字符串首尾空格
- replace():替换字符串中的某些字符
- split():把字符串分割并返回字符串数组
- join():把字符串数组转为字符串
自疑解析
- 在String源码中的很多地方都使用了如anotherString.value的用法去获取String实例的value属性,但是value是私有的(private)?为什么可以这样操作呢?
解析:java的访问控制符是基于类的,而不是基于对象,anotherString是一个String对象;在String本类中,它可以访问不同String类实例(即String对象)的私有成员变量。
常见面试题
- == 和 equals的区别
- == 对于基本数据类型来说,是用于比较 “值”是否相等的;而对于引用类型来说,是用于比较引用地址是否相同的。
- 在Object类的源码中,equals()就等价于==,即一般情况下两者没区别
public boolean equals(Object obj) {
return (this == obj);
}
- 而在String类中,重写了equals()方法,用于比较字符串是否相等
-
为什么 String 类型要用 final 修饰?
- 安全:当你在调用其他方法时,比如调用一些系统级操作指令之前,可能会有一系列校验,如果是可变类的话,可能在你校验过后,它的内部的值又被改变了,这样有可能会引起严重的系统崩溃问题。
- 高效:当你在传参时不需要考虑谁会修改它的值;如果是可变类的话,则有可能需要重新拷贝出来一个新值进行传参,这样在性能上就会有一定的损失。
-
String 和 StringBuilder、StringBuffer 的区别
- 因为 String 类型是不可变的,所以在字符串拼接的时候如果使用 String 的话性能会很低,因此我们就需要使用另一个数据类型 StringBuffer,它提供了 append 和 insert 方法可用于字符串的拼接,它使用 synchronized 来保证线程安全。同时因为它使用了 synchronized 来保证线程安全,所以性能不是很高,于是在 JDK 1.5 就有了 StringBuilder,它同样提供了 append 和 insert 的拼接方法,但它没有使用 synchronized 来修饰,因此在性能上要优于 StringBuffer,所以在非并发操作的环境下可使用 StringBuilder 来进行字符串拼接。
- String 的 intern() 方法有什么含义?
-
String.intern() 方法可以使得所有含相同内容的字符串都共享同一个内存对象,可以节省内存空间。
-
JVM 中,存在一个字符串常量池,字符串的值都存放在这个池中。当调用 intern 方法时,如果字符串常量池中已经存在该字符串,那么返回池中的字符串引用;否则将此字符串添加到字符串常量池中,并返回字符串的引用。
JDK1.6 和 JDK1.7 在 intern() 方法的实现上,有相同,也有不同。
-
相同点: 先去查看字符串常量池是否有该字符串,如果有,则返回字符串常量池中的引用。
-
不同点: 如果是 JDK1.7,当字符串常量池中找不到对应的字符串时,不会将字符串拷贝到字符串常量池,而只是在字符串常量池生成一个对该字符串的引用。而 JDK1.6 会拷贝字符串至字符串常量池。
-
JDK1.6 中,常量池在方法区。JDK1.7 中,常量池移到堆区了。
-
详细解析可参考String的Intern方法详解
- String 类型在 JVM(Java 虚拟机)中是如何存储的?编译器对 String 做了哪些优化?
-
String 常见的创建方式有两种,new String() 的方式和直接赋值的方式:
- 直接赋值的方式会先去字符串常量池中查找是否已经有此值,如果有则把引用地址直接指向此值,否则会先在常量池中创建,然后再把引用指向此值;
- new String() 的方式一定会先在堆上创建一个字符串对象,然后再去常量池中查询此字符串的值是否已经存在,如果不存在会先在常量池中创建此字符串,然后把引用的值指向此字符串
-
编译器对String的优化
String s1 = "Ja" + "va";//直接被编译为"Java"
String s2 = "Java";
System.out.println(s1 == s2);//true