String类是Java开发中经常使用的类,使用频率极高,也是面试考核的重点,我们是否详细了解String类的一些特点。以JDK8为例,我们看看String类,可以看到是被final修饰的类,也就是不能被继承,方法也不能被覆盖,字符串被存储到char[]数组中。
public final class String
implements java.io.Serializable, Comparable<String>, CharSequence {
/** 用于存储字符串的值 */
private final char value[];
/** 缓存字符串的 hash code */
private int hash; // Default to 0
//其他代码....
}
1.多重构造:String类中许多的构造方法:
其中由四个比较重要的构造方法:其中,比较容易被我们忽略的是以 StringBuffer 和 StringBuilder 为参数的构造函数,因为这两种数据类型,我们通常都是单独使用的。
// String 为参数的构造方法
public String(String original) {
this.value = original.value;
this.hash = original.hash;
}
// char[] 为参数构造方法
public String(char value[]) {
this.value = Arrays.copyOf(value, value.length);
}
// StringBuffer 为参数的构造方法:这就是为什么StringBuffer是线程安全的
public String(StringBuffer buffer) {
synchronized(buffer) {
this.value = Arrays.copyOf(buffer.getValue(), buffer.length());
}
}
// StringBuilder 为参数的构造方法
public String(StringBuilder builder) {
this.value = Arrays.copyOf(builder.getValue(), builder.length());
}
2.equals() 比较两个字符串是否相等,源码如下:
public boolean equals(Object anObject) {
if (this == anObject) {
return true;
}
if (anObject instanceof String) {
String anotherString = (String)anObject;
int n = value.length;
if (n == anotherString.value.length) {
char v1[] = value;
char v2[] = anotherString.value;
int i = 0;
while (n-- != 0) {
if (v1[i] != v2[i])
return false;
i++;
}
return true;
}
}
return false;
}
从源码看出,String重写了Object equals()方法,如果是当前对象,直接返回true;通过instanceof关键字判断,如果不是String类型的对象,直接返回false。然后再通过遍历String中的字符,如果每一个字符都相同,则返回true,否则返回false。instanceof 的简单使用如下:
Object obj1 = "123";
Object obj2 = 123;
System.out.println(obj1 instanceof String); // 返回 true
System.out.println(obj2 instanceof String); // 返回 false
3. compareTo() 比较两个字符串,源码如下:
public int compareTo(String anotherString) {
int len1 = value.length;
int len2 = anotherString.value.length;
int lim = Math.min(len1, len2);
char v1[] = value;
char v2[] = anotherString.value;
int k = 0;
while (k < lim) {
char c1 = v1[k];
char c2 = v2[k];
if (c1 != c2) {
return c1 - c2;
}
k++;
}
return len1 - len2;
}
从源码中可以看出,compareTo() 方法会循环对比所有的字符,当两个字符串中有任意一个字符不相同时,则 return char1-char2。比如,两个字符串分别存储的是 1 和 2,返回的值是 -1;如果存储的是 1 和 1,则返回的值是 0 ,如果存储的是 2 和 1,则返回的值是 1。
其实:compareTo()方法对比两个字符串,如果完全相同,则返回0;部分相同,则返回不相同字符串的个数;完全不相同,直接返回1或者-1。
String str1 = "aaa";
String str2 = "aaa";
String str3 = "aaaaaaa";
String str4 = "bbbbbbb";
System.out.println(str1.compareTo(str2));//返回0
System.out.println(str1.compareTo(str3));//返回-4
System.out.println(str1.compareTo(str4));//返回-1
还有一个和 compareTo() 比较类似的方法 compareToIgnoreCase(),用于忽略大小写后比较两个字符串。
可以看出 compareTo() 方法和 equals() 方法都是用于比较两个字符串的,但它们有两点不同:
equals() 可以接收一个 Object 类型的参数,而 compareTo() 只能接收一个 String 类型的参数;
equals() 返回值为 Boolean,而 compareTo() 的返回值则为 int。
4.==和equals的区别
先来看看Object的equals方法,源码如下:
public boolean equals(Object obj) {
return (this == obj);
}
Object的equal方法就是==,比较的是两个对象是否是同一个对象。String重写了Object的equals方法,比较的是两个字符串的值。
5.final修饰的好处
从 String 类的源码我们可以看出 String 是被 final 修饰的不可继承类。那这样设计有什么好处呢?
Java 语言之父 James Gosling 的回答是,他会更倾向于使用 final,因为它能够缓存结果,当你在传参时不需要考虑谁会修改它的值;如果是可变类的话,则有可能需要重新拷贝出来一个新值进行传参,这样在性能上就会有一定的损失。
James Gosling 还说迫使 String 类设计成不可变的另一个原因是安全,当你在调用其他方法时,比如调用一些系统级操作指令之前,可能会有一系列校验,如果是可变类的话,可能在你校验过后,它的内部的值又被改变了,这样有可能会引起严重的系统崩溃问题,这是迫使 String 类设计成不可变类的一个重要原因。
总结来说,使用 final 修饰的第一个好处是安全;第二个好处是高效,以 JVM 中的字符串常量池来举例,如下两个变量:
String s1 = "java";
String s2 = "java";
只有字符串是不可变时,我们才能实现字符串常量池,字符串常量池可以为我们缓存字符串,提高程序的运行效率,如下图所示:说白了,相同的字符串都是共用常量池同一个字符串。试想一下如果 String 是可变的,那当 s1 的值修改之后,s2 的值也跟着改变了,这样就和我们预期的结果不相符了,因此也就没有办法实现字符串常量池的功能了。
如果 String 是可变的,那当 s1 的值修改之后,s2 的值也跟着改变了,这样就和我们预期的结果不相符了,因此也就没有办法实现字符串常量池的功能了。
6. String 和 StringBuilder、StringBuffer 的区别
因为 String 类型是不可变的,所以在字符串拼接的时候如果使用 String 性能会很低,StringBuilder和SpringBuffer都是继承的AbstractStringBuilder,拼接字符串都是调用的AbstractStringBuilder的append方法。 StringBuffer使用了synchronized 来保证线程安全,如下源码所示:
//AbstractStringBuilder实现append方法
public AbstractStringBuilder append(String str) {
if (str == null)
return appendNull();
int len = str.length();
ensureCapacityInternal(count + len);
str.getChars(0, len, value, count);
count += len;
return this;
}
//StringBuilder的append方法,很明显是调用了父类AbstractStringBuilder的append方法
@Override
public StringBuilder append(String str) {
super.append(str);
return this;
}
//StringBuffer的append方法,也是父类AbstractStringBuilder的append方法,加上了synchronized 保证线程的安全
@Override
public synchronized StringBuffer append(char[] str) {
toStringCache = null;
super.append(str);
return this;
}
7.String 和 JVM
String 常见的创建方式有两种,new String() 的方式和直接赋值的方式,直接赋值的方式会先去字符串常量池中查找是否已经有此值,如果有则把引用地址直接指向此值,否则会先在常量池中创建,然后再把引用指向此值;而 new String() 的方式一定会先在堆上创建一个字符串对象,然后再去常量池中查询此字符串的值是否已经存在,如果不存在会先在常量池中创建此字符串,然后把引用的值指向此字符串,如下代码所示:
这就是为什么我们不建议使用new String的方法创建字符串了吧。多了一个在堆上创建了字符串的对象,其实这个字符串对象还是指向的常量池。
下面看看下面的比较:
String s1 = new String("Java");//从堆中取出的,然后指向的常量池。
String s2 = s1.intern();//直接从常量池取出的
String s3 = "Java"; //直接从常量池取出的
String s4 = "Ja" + "va";//直接从常量池取出的
String s5 = new String("Java");//从堆中取出的,然后指向的常量池。
System.out.println(s1 == s2); // false
System.out.println(s2 == s3); // true
System.out.println(s1 == s3);// false
System.out.println(s3 == s4);// true
System.out.println(s1 == s5);// false
由此得出一个结论,直接常量池取出相同的字符串,==比较都是返回true,因为他们是同一个对象。由此分析出:s2,s3,s4是同一个对象。s1和s5尽管都是new String("Java"),很明显,不是同一个对象。