你好,我是你的 Java 面试课老师王磊,欢迎进入第 01 课时的内容“String 的特点是什么?它有哪些重要的方法?”。
几乎所有的 Java 面试都是以 String 开始的,如果第一个问题没有回答好,则会给面试官留下非常不好的第一印象,而糟糕的第一印象则会直接影响到自己的面试结果,就好像刚破壳的小鹅一样,会把第一眼看到的动物当成自己的母亲,即使它第一眼看到的是一只小狗或小猫,也会默认跟随其后,心理学把这种现象叫做印刻效应。印刻效应不仅存在于低等动物之中,同样也适用于人类,所以对于 String 的知识,我们必须深入的掌握才能为自己赢得更多的筹码。
本课时的问题是:String 是如何实现的?它有哪些重要的方法?
典型回答
以主流的 JDK 版本 1.8 来说,String 内部实际存储结构为 char 数组,源码如下:
public final class String
implements java.io.Serializable, Comparable<String>, CharSequence {
// 用于存储字符串的值
private final char value[];
// 缓存字符串的 hash code
private int hash; // Default to 0
// ......其他内容
}
String 源码中包含下面几个重要的方法。
1. 多构造方法
String 字符串有以下 4 个重要的构造方法:
// String 为参数的构造方法
public String(String original) {
this.value = original.value;
this.hash = original.hash;
}
// char[] 为参数构造方法
public String(char value[]) {
this.value = Arrays.copyOf(value, value.length);
}
// StringBuffer 为参数的构造方法
public String(StringBuffer buffer) {
synchronized(buffer) {
this.value = Arrays.copyOf(buffer.getValue(), buffer.length());
}
}
// StringBuilder 为参数的构造方法
public String(StringBuilder builder) {
this.value = Arrays.copyOf(builder.getValue(), builder.length());
}
其中,比较容易被我们忽略的是以 StringBuffer 和 StringBuilder 为参数的构造函数,因为这三种数据类型,我们通常都是单独使用的,所以这个小细节我们需要特别留意一下。
2. equals() 比较两个字符串是否相等
源码如下:
public boolean equals(Object anObject) {
// 对象引用相同直接返回 true
if (this == anObject) {
return true;
}
// 判断需要对比的值是否为 String 类型,如果不是则直接返回 false
if (anObject instanceof String) {
String anotherString = (String)anObject;
int n = value.length;
if (n == anotherString.value.length) {
// 把两个字符串都转换为 char 数组对比
char v1[] = value;
char v2[] = anotherString.value;
int i = 0;
// 循环比对两个字符串的每一个字符
while (n-- != 0) {
// 如果其中有一个字符不相等就 true false,否则继续对比
if (v1[i] != v2[i])
return false;
i++;
}
return true;
}
}
return false;
}
String 类型重写了 Object 中的 equals() 方法,equals() 方法需要传递一个 Object 类型的参数值,在比较时会先通过 instanceof 判断是否为 String 类型,如果不是则会直接返回 false,instanceof 的使用如下:
Object oString = "123";
Object oInt = 123;
System.out.println(oString instanceof String); // 返回 true
System.out.println(oInt instanceof String); // 返回 false
当判断参数为 String 类型之后,会循环对比两个字符串中的每一个字符,当所有字符都相等时返回 true,否则则返回 false。
还有一个和 equals() 比较类似的方法 equalsIgnoreCase(),它是用于忽略字符串的大小写之后进行字符串对比。
3. compareTo() 比较两个字符串
compareTo() 方法用于比较两个字符串,返回的结果为 int 类型的值,源码如下:
public int compareTo(String anotherString) {
int len1 = value.length;
int len2 = anotherString.value.length;
// 获取到两个字符串长度最短的那个 int 值
int lim = Math.min(len1, len2);
char v1[] = value;
char v2[] = anotherString.value;
int k = 0;
// 对比每一个字符
while (k < lim) {
char c1 = v1[k];
char c2 = v2[k];
if (c1 != c2) {
// 有字符不相等就返回差值
return c1 - c2;
}
k++;
}
return len1 - len2;
}
从源码中可以看出,compareTo() 方法会循环对比所有的字符,当两个字符串中有任意一个字符不相同时,则 return char1-char2。比如,两个字符串分别存储的是 1 和 2,返回的值是 -1;如果存储的是 1 和 1,则返回的值是 0 ,如果存储的是 2 和 1,则返回的值是 1。
还有一个和 compareTo() 比较类似的方法 compareToIgnoreCase(),用于忽略大小写后比较两个字符串。
可以看出 compareTo() 方法和 equals() 方法都是用于比较两个字符串的,但它们有两点不同:
- equals() 可以接收一个 Object 类型的参数,而 compareTo() 只能接收一个 String 类型的参数;
- equals() 返回值为 Boolean,而 compareTo() 的返回值则为 int。
它们都可以用于两个字符串的比较,当 equals() 方法返回 true 时,或者是 compareTo() 方法返回 0 时,则表示两个字符串完全相同。
4. 其他重要方法
- indexOf():查询字符串首次出现的下标位置
- lastIndexOf():查询字符串最后出现的下标位置
- contains():查询字符串中是否包含另一个字符串
- toLowerCase():把字符串全部转换成小写
- toUpperCase():把字符串全部转换成大写
- length():查询字符串的长度
- trim():去掉字符串首尾空格
- replace():替换字符串中的某些字符
- split():把字符串分割并返回字符串数组
- join():把字符串数组转为字符串
考点分析
这道题目考察的重点是,你对 Java 源码的理解,这也从侧面反应了你是否热爱和喜欢专研程序,而这正是一个优秀程序员所必备的特质。
String 源码属于所有源码中最基础、最简单的一个,对 String 源码的理解也反应了你的 Java 基础功底。
String 问题如果再延伸一下,会问到一些更多的知识细节,这也是大厂一贯使用的面试策略,从一个知识点入手然后扩充更多的知识细节,对于 String 也不例外,通常还会关联的询问以下问题:
- 为什么 String 类型要用 final 修饰?
- == 和 equals 的区别是什么?
- String 和 StringBuilder、StringBuffer 有什么区别?
- String 的 intern() 方法有什么含义?
- String 类型在 JVM(Java 虚拟机)中是如何存储的?编译器对 String 做了哪些优化?
接下来我们一起来看这些问题的答案。
知识扩展
1. == 和 equals 的区别
== 对于基本数据类型来说,是用于比较 “值”是否相等的;而对于引用类型来说,是用于比较引用地址是否相同的。
查看源码我们可以知道 Object 中也有 equals() 方法,源码如下:
public boolean equals(Object obj) {
return (this == obj);
}
可以看出,Object 中的 equals() 方法其实就是 ==,而 String 重写了 equals() 方法把它修改成比较两个字符串的值是否相等。
源码如下:
public boolean equals(Object anObject) {
// 对象引用相同直接返回 true
if (this == anObject) {
return true;
}
// 判断需要对比的值是否为 String 类型,如果不是则直接返回 false
if (anObject instanceof String) {
String anotherString = (String)anObject;
int n = value.length;
if (n == anotherString.value.length) {
// 把两个字符串都转换为 char 数组对比
char v1[] = value;
char v2[] = anotherString.value;
int i = 0;
// 循环比对两个字符串的每一个字符
while (n-- != 0) {
// 如果其中有一个字符不相等就 true false,否则继续对比
if (v1[i] != v2[i])
return false;
i++;
}
return true;
}
}
return false;
}
2. final 修饰的好处
从 String 类的源码我们可以看出 String 是被 final 修饰的不可继承类,源码如下:
public final class String
implements java.io.Serializable, Comparable<String>, CharSequence { //...... }
那这样设计有什么好处呢?
Java 语言之父 James Gosling 的回答是,他会更倾向于使用 final,因为它能够缓存结果,当你在传参时不需要考虑谁会修改它的值;如果是可变类的话,则有可能需要重新拷贝出来一个新值进行传参,这样在性能上就会有一定的损失。
James Gosling 还说迫使 String 类设计成不可变的另一个原因是安全,当你在调用其他方法时,比如调用一些系统级操作指令之前,可能会有一系列校验,如果是可变类的话,可能在你校验过后,它的内部的值又被改变了,这样有可能会引起严重的系统崩溃问题,这是迫使 String 类设计成不可变类的一个重要原因。
总结来说,使用 final 修饰的第一个好处是安全;第二个好处是高效,以 JVM 中的字符串常量池来举例,如下两个变量:
String s1 = "java";
String s2 = "java";
只有字符串是不可变时,我们才能实现字符串常量池,字符串常量池可以为我们缓存字符串,提高程序的运行效率,如下图所示:
试想一下如果 String 是可变的,那当 s1 的值修改之后,s2 的值也跟着改变了,这样就和我们预期的结果不相符了,因此也就没有办法实现字符串常量池的功能了。
3. String 和 StringBuilder、StringBuffer 的区别
因为 String 类型是不可变的,所以在字符串拼接的时候如果使用 String 的话性能会很低,因此我们就需要使用另一个数据类型 StringBuffer,它提供了 append 和 insert 方法可用于字符串的拼接,它使用 synchronized 来保证线程安全,如下源码所示:
@Override
public synchronized StringBuffer append(Object obj) {
toStringCache = null;
super.append(String.valueOf(obj));
return this;
}
public synchronized StringBuffer append(String str) {
toStringCache = null;
super.append(str);
return this;
}
因为它使用了 synchronized 来保证线程安全,所以性能不是很高,于是在 JDK 1.5 就有了 StringBuilder,它同样提供了 append 和 insert 的拼接方法,但它没有使用 synchronized 来修饰,因此在性能上要优于 StringBuffer,所以在非并发操作的环境下可使用 StringBuilder 来进行字符串拼接。
4. String 和 JVM
String 常见的创建方式有两种,new String() 的方式和直接赋值的方式,直接赋值的方式会先去字符串常量池中查找是否已经有此值,如果有则把引用地址直接指向此值,否则会先在常量池中创建,然后再把引用指向此值;而 new String() 的方式一定会先在堆上创建一个字符串对象,然后再去常量池中查询此字符串的值是否已经存在,如果不存在会先在常量池中创建此字符串,然后把引用的值指向此字符串,如下代码所示:
String s1 = new String("Java");
String s2 = s1.intern();
String s3 = "Java";
System.out.println(s1 == s2); // false
System.out.println(s2 == s3); // true
它们在 JVM 存储的位置,如下图所示:
小贴士:JDK 1.7 之后把永生代换成的元空间,把字符串常量池从方法区移到了 Java 堆上。
除此之外编译器还会对 String 字符串做一些优化,例如以下代码:
String s1 = "Ja" + "va";
String s2 = "Java";
System.out.println(s1 == s2);
虽然 s1 拼接了多个字符串,但对比的结果却是 true,我们使用反编译工具,看到的结果如下:
Compiled from "StringExample.java"
public class com.lagou.interview.StringExample {
public com.lagou.interview.StringExample();
Code:
0: aload_0
1: invokespecial #1 // Method java/lang/Object."<init>":()V
4: return
LineNumberTable:
line 3: 0
public static void main(java.lang.String[]);
Code:
0: ldc #2 // String Java
2: astore_1
3: ldc #2 // String Java
5: astore_2
6: getstatic #3 // Field java/lang/System.out:Ljava/io/PrintStream;
9: aload_1
10: aload_2
11: if_acmpne 18
14: iconst_1
15: goto 19
18: iconst_0
19: invokevirtual #4 // Method java/io/PrintStream.println:(Z)V
22: return
LineNumberTable:
line 5: 0
line 6: 3
line 7: 6
line 8: 22
}
从编译代码 #2 可以看出,代码 "Ja"+"va" 被直接编译成了 "Java" ,因此 s1==s2 的结果才是 true,这就是编译器对字符串优化的结果。
小结
本课时从 String 的源码入手,重点讲了 String 的构造方法、equals() 方法和 compareTo() 方法,其中 equals() 重写了 Object 的 equals() 方法,把引用对比改成了字符串值对比,也介绍了 final 修饰 String 的好处,可以提高效率和增强安全性,同时我们还介绍了 String 和 JVM 的一些执行细节。
精选评论
**科:
更新有点慢,更新完面试季都过了!!!!!!!!😂
编辑回复:
已反馈给讲师哈,目前该课程每周三、五更新,一周更新两课时。
*鑫:
留言不能复制...不能撸代码...格式换下的就上万字不准提交,你们这个能不能优化下...要不然还搞什么留言?1. String s1 = "Ja" + "va"; 编译期 被jvm优化编译为java 常量池不存在就创建。2. String s2 = "Java"; 编译期 常量池不存在就创建。3. String s3 = new String("java"); 常量池的"java"在编译期确认,类加载的时候创建(常量池不存在时); 堆中的"java"是在运行时确定,在new时创建。4. String s4 = "Ja"; String s5 = "va"; String s6 = s4 + s5;s6 反编译为(new StringBuilder()).append(s4).append(s5).toString(), s1在编译期为常量,s6被编译为StringBuilder及append, s6常量池只有Ja和va,这是s4和s5编译的, 字符串拼接中,有一个参数是变量的话,整个拼接操作会被编译成StringBuilder.append, 这种情况编译器是无法知道其确定值的,只有在运行期才能确定。5. String s7 = (s4 + s5).intern(); 把字符串字面量放入常量池(不存在的话), 返回这个常量的引用。6. System.out.println(s1 == s2); // true。 System.out.println(s2 == s3); // false。 System.out.println(s1 == s6); // false。 System.out.println(s1 == s7); // true
**涛:
更新好慢哟!!!能不能更新快一点呢
编辑回复:
已将意见反馈给讲师,后期会加快更新频率
**淋:
讲得不错 但确实更新太慢了😂
编辑回复:
已反馈给讲师,后期会加快更新节凑
**明:
第一次接触拉勾的文章。这篇文章只值一块钱。真的太值了。可以说对于string讲的太好了。深入底层。逻辑清晰。讲的太好了。
编辑回复:
感谢认可,要坚持来听课哦~
**斌:
今天看了一眼源码,高版string用的byte数组存储,网上搜了一下,没找到相关说明,老师有了解么
讲师回复:
Java 9 之后 String 的存储就从 char 数组转成了 byte 数组,这样做的好处是存储变的更紧凑,占用的内存更少,操作性能更高了。
**思:
什么时候可以更新完?
编辑回复:
现在是每周三、五更新,一周更新两个课时哈
**4387:
String s1 = new String("Java");String s2 = s1.intern();String s3 = "Java";System.out.println(s1 == s2); // falseSystem.out.println(s2 == s3); // true这里的结果注释是错了吧?
**福:
还不错,不光是知识,还有掌握技术细节的研究思路、方法,那些个奇葩面试题有的连博客和书里都找不到,就需要平时多想一步为什么,做下试验
thd:
比较清楚 还是很基础的
编辑回复:
把基础打牢,后续的学习才能如鱼得水~
*阵:
有助于加强理解,如果有更多的图示会更好
编辑回复:
已反馈给讲师,后期会注意~
*匪:
String char[] value数组怎么初始化的讲讲啊,
讲师回复:
这个已经超出了字符串的知识点了
**0354:
讲的很好
**纲:
没有看视频,只看了文字,感觉很不错。
Ff:
James Gosling,请问这个人说的final修饰的好处能具体讲下么?不懂啊
讲师回复:
文章有讲到,一个是提高了安全性,另一个是提高了效率。
*鑫:
更新的太慢了,等更新完都过了面试的时候了、
编辑回复:
已反馈给讲师,后期会加快更新节凑
*航:
讲的挺好,比较细致,适合巩固基础掌握重点!
**栓:
永久代和元空间不都是方法区的实现方式么,JDK1.8将永久代移除,然后加上了元空间,元空间是直接共享使用的机器物理内存,应该是独立于jvm堆内存的呀,文中谈到的字符串常量池移到了堆中,具体是堆中的哪个区域?
讲师回复:
元空间确实在本地内存中,这个没有异议,但本地直接内存中主要存储的是类型信息,而字符串常量池已经在 JDK 7 时被移除方法区,放到堆中了。你可以将 -Xmx 设置小一些,然后 while 循环调用 String.valueOf(i++).intern() 看 OOM 异常信息 Java heap space 就可以看出字符串常量池已经被移到堆中了,或者是看周志明的《深入理解Java虚拟机》2.4 实战:OutOfMemoryError 里面有写。
**新:
老师讲的很好,学完就跳槽
编辑回复:
哈哈小编祝你学业有成,跳槽成功。
**2115:
整理的很不错,学习了
**彬:
我能一天学十章,快更新快更新啊
编辑回复:
已经把大家高涨的学习热情反馈给讲师啦,后期会加快更新节奏
**用户7139:
求多更!讲得很好
编辑回复:
感谢认可!我们已反馈给讲师,后期会加快更新节凑~
**帅:
你好,个人感觉在String 和 StringBuilder、StringBuffer 的区别与jvm的讲解还是有些浅,能再讲的深一些吗,谢谢
编辑回复:
已反馈给讲师,后期课程的内容会逐步加深
*翼:
赞讲的不错谢谢老师
编辑回复:
谢谢认可,记得按时来听课哦
*奇:
够基础,带着你过源码
**娇:
“当你在调用其他方法时,比如调用一些系统级操作指令之前,可能会有一系列校验,如果是可变类的话,可能在你校验过后,它的内部的值又被改变了”中“可能在你教验过后,它的内部值又被改变了”被谁改变?难道String a=“1”被设置为a=“2”就不算改变吗?
讲师回复:
文中想要表达含义是:如果不是“不可变”的,那么就会有被篡改的风险,那么他就可能会产生问题。这里的修改并不是显示的常规代码级别的修改(这种修改是业务代码的需求,是被允许的安全性修改),这种的修改指的是使用非常规手段注入和篡改所带来的运行和预期不相符的非安全性修改哦。
**洲:
永生代换成的元空间到底是 1.8 还是 1.7 ?
讲师回复:
jdk 1.8 。有空的时候可以看看《深入理解Java虚拟机》第三版 123 页有写哈。
Null:
有两个问题请教:1为何string=“xxx”,这种方式会直接在常量池中创建,要知道string的内部是char/byte数组,总得有个地方去存储它们吧,堆空间还是应该开辟才对。2.final提升性能是如何做到的?即便不是final也一样可以提升性能啊,
讲师回复:
问题 1 也可以这样理解,不同的虚拟机实现有所区别,以 Hotspot 来说,在 JDK 1.7 之前常量池(运行时常量池和字符串常量池)都在方法区,而《Java虚拟机规范》对于方法区的描述为堆的一个逻辑部分。至于被 final 修饰主要的优点是安全,还有就是不可变更(只读)、线程安全,因此效率也能略高一些。
*炜:
跟着视频,看了String的源码,课程很nice!物超所值!
**2436:
分析equals的代码里,突然出现一个value,这个value从哪里来的呀?
讲师回复:
value 是存储值的容器
**泽:
刚学,讲得不错
**鸣:
非常感谢老师,在老师的带领下,今天上午自己把String里的equals()、equalsIgnoreCase()、compareTo()、compareToIgnoreCase()这四个方法的源代码给看了一遍,关键是自己理解了每行代码的意思,感觉到了源代码也不是很难。非常感谢,之后跟着老师的脚步,学好每一篇文章,平时也养成看源代码的习惯。🙏
**鸣:
刚刚说到的字符串new的创建方式,不管有没有肯定先创建这个字符串,然后如果堆中字符串常量池没有该值则直接放入,是不是少介绍了一种堆中字符串常量池有该值的情况,那么如何处理?是替换原有的?还是舍去新创建的保留原有的?
讲师回复:
字符串常量池的作用就是使用已有的字符串来提高程序的执行效率,是复用哦。
**威:
Java 语言之父 James Gosling 的回答是,他会更倾向于使用 final,因为它能够缓存结果,当你在传参时不需要考虑谁会修改它的值;如果是可变类的话,则有可能需要重新拷贝出来一个新值进行传参,这样在性能上就会有一定的损失。
老师,对于这句话我不太理解 final 类在传参的作用,例如传参的不是 String,而是一个普通的 Object 类型,它不是 final,传参的时候是不需要拷贝一个新对象出来的吧
讲师回复:
是的可以这样理解,或者只需要记它的 3 重点优势:1、可以利用不可变性实现字符串常量池;2、非常适合做 HashMap 的 key(因为不变);3、天生线程安全。
*杰:
第一次感受到介绍的这么好,拿着小本子写下了😀
**铭:
String 的 intern() 方法有什么含义?
老师,貌似这个问题没有解答吧?
讲师回复:
String#intern 是一个 native 方法,注释写的很详细,“如果常量池中存在当前字符串, 就会直接返回当前字符串. 如果常量池中没有此字符串, 会将此字符串放入常量池中后, 再返回”
**宇:
有点疑惑,string类是final的与传参值不变有什么关系啊
讲师回复:
意思是,如果是这样 final 的参数 private static void upString(final String str) { 就不能修改了,而非 fianl 是可以修改的。
*辉:
// StringBuffer 为参数的构造方法public String(StringBuffer buffer) {synchronized(buffer) {this.value = Arrays.copyOf(buffer.getValue(), buffer.length());}}这里加同步代码块的原因是StringBuffer是线程安全的原因吗
讲师回复:
这是 JDK 的源码,原因大概是为了保证线程安全。
**东:
new String() 如果常量池中没有此字符串的值,那么会在常量池中创建。
首先new的时候会在堆中创建对象,如果常量池中没有这个值,不是直接把刚刚创建的对象的值搬到堆中然后把引用指向它就可以了吗,为什么还要在常量池中创建一个?
讲师回复:
new String() 是先去判断的,还没有创建对象呢。
**新:
希望能快点更新
*罗:
讲的清晰透彻!
**敏:
老师讲的很好很清晰,比极客时间那个核心精讲好多了,看那个差点没气死;
不过能不能每天更新啊这样太慢了
编辑回复:
谢谢认可!坚持学下去,相信你会get更多课程的精髓~关于更新频次我们已经反馈给讲师,后续会加快更新节奏的~
**龙:
有个地方不清楚
String s1 = “Ja” + “va”;String s2 = “Java”;System.out.println(s1 == s2);如果这样的话,意思是常量池中不存在"Ja"和"va"吗?
讲师回复:
常量池不会有 “ja”、“va”,代码在编译器阶段被优化成了"Java"
**阳:
更新太慢了
编辑回复:
已反馈给讲师,后期会加快更新节凑
**国:
跟着大佬长知识!
*杰:
求快点更新
编辑回复:
已反馈给讲师,
**萍:
求更新的快一点,等不及看下一课的
编辑回复:
好的,您的意见已反馈给讲师,后期会加快更新节凑
*伟:
为啥还没更新😭
编辑回复:
该课程每周三、周五更新哈
*健:
讲的很好,就是更新太慢了。
编辑回复:
您的意见我们已将反馈给讲师,后续会加快更新节奏。目前该课程每周三、周五更新哈
**旭:
为何只能看第一讲
编辑回复:
该课程每周三、周五更新哈,每周更新两个课时
**炎:
更新好慢的,具体更新时间能精确到几点嘛😀
编辑回复:
具体的更新时间还是要看排版的时间 不过更新完成之后会有短信提醒
*新:
赞。。还是说的有一些不知道的知识点,比如string 从堆 转移到 常量池的方法inter 。就是更新可以快些。不然 面试都过了😀😀😀
编辑回复:
嗯嗯,您的意见我们已经反馈给讲师,后续会加快更新节奏
*涛:
课程不错 就是更新有点慢
编辑回复:
已反馈给讲师,后期会加快更新节凑
**峰:
讲的很仔细又有源码,很棒,但是更新太慢了啊,34月是关键月份错过就难找了啊,跪求更新快点
编辑回复:
好哒,我们已经把大家的需求反馈给讲师,后期会加快更新节凑~
**锋:
大佬,感觉 String 和 StringBuilder、StringBuffer 的区别这个是高频面试题,可以讲深一点,文中这样讲面试过不去的😂
讲师回复:
感谢反馈,建议配合 Java 源码查看,源码不是很大,读完就能做到心中有数了。
*胜:
非常好,建议更新快一些,谢谢
编辑回复:
已反馈给讲师,后期会加快更新节凑
*仁:
王老师你好,这一张有个问题,在类上面是用final是表示这个类是最终类,不可被继承。跟实际的内容变化应该没关系,如果希望string这个变量不可变应该是声明变量的前面加final。不知道我的理解有没有误,希望王老师抽空可以解答一下
讲师回复:
对的,你的理解没问题,final 语义是这样的。
**鹏:
第二讲更新还要多久?觉得讲的很详细
编辑回复:
每周三、五更新,记得按时来听课哦
**可:
讲的挺好的
**2021:
讲的确实很全,决定学下去
编辑回复:
加油哦,后面的课程更精彩~