String详解
1.数据结构:char数组:被final修饰,表示不可变,所以String一旦初始化之后不能改变;
offset字段:offset有抵消的含义,在String里面表示数组存储的第一个索引;
count字段:为数组的长度,实际上等于str.length();
hash字段:在第一次获取hashCode的时候会初始化,之后再调用不会再计算;
2.主要方法:
其他方法可以不知道,但是toCharArray一定要知道,他是String的核心,方法的实现是新new一个char[]对象,然后使用本地方法复制了一个数组;
public char[] toCharArray() {
char result[] = new char[value.length];
System.arraycopy(value, 0, result, 0, value.length);
return result;
}
hashCode方法,这里需要知道他第一次需要计算并保存,后面不用计算;
public int hashCode() {
int h = hash;
if (h == 0 && value.length > 0) {
char val[] = value;
for (int i = 0; i < value.length; i++) {
h = 31 * h + val[i];
}
hash = h;
}
return h;
}
equals方法,可以重点看他的实现思路,先比较是否是同一个对象,再比较目标对象是否是String类型,再比较长度,再将两个对象转换成char数组进行遍历比较,每个判断都是恰到好处;
public boolean equals(Object anObject) {
if (this == anObject) {
return true;
}
if (anObject instanceof String) {
String anotherString = (String)anObject;
int n = value.length;
if (n == anotherString.value.length) {
char v1[] = value;
char v2[] = anotherString.value;
int i = 0;
while (n-- != 0) {
if (v1[i] != v2[i])
return false;
i++;
}
return true;
}
}
return false;
}
getBytes方法,之前面试阿里叫我处理两个String,我居然把String转成byte[]来处理,当时脑袋打铁,为啥不直接转成toCharArray()?因为平时很少关注这些源码,例如String str = "abcd"; byte[] bt = str.getBytes();bt实际上是[97, 98, 99, 100],他的内部实现很复杂,底层都用到了ByteBuffer,CharBuffer,在性能上面简直和toCharArr()没有可比性,这里需要掌握一个基本数据类型的概念,和他的底层实现,里面会有nio的内容,后面我也会慢慢讲到;
byte是字节数据类型、有符号型的、占1个字节、大小范围为-128-127
char是字符数据类型、无符号型的、占2个字节(unicode码)、大小范围为0-65535
// char转byte
private byte[] getBytes (char[] chars) {
Charset cs = Charset.forName ("UTF-8");
CharBuffer cb = CharBuffer.allocate (chars.length);//初始化一个字符buffer,长度为数组的长度
cb.put (chars);
cb.flip ();//将一个字符buffer从写模式转换成读模式
ByteBuffer bb = cs.encode (cb);//将union编码转成字符集
return bb.array();
}
// byte转char
private char[] getChars (byte[] bytes) {
Charset cs = Charset.forName ("UTF-8");
ByteBuffer bb = ByteBuffer.allocate (bytes.length);
bb.put (bytes);
bb.flip ();
CharBuffer cb = cs.decode (bb);
return cb.array();
}
indexOf,返回该字符串第一次出现在原字符串的索引,没有就返回-1,实现比较简单,和equals有点类似,就不赘述了;
public int indexOf(String str) ;
substring截取字符串;
public String substring(int beginIndex, int endIndex);
charAt,其实写到这里认真看了源码,我不得不感叹jdk作者真是牛逼,这些方法名字取得见字知其义;
public char charAt(int index);
其他方法就不赘述了,不是说不重要,只是只要我们知道了String的底层实现其实是数组,想不起某些方法其实不要紧,自己写一个也无妨。