字符串相关的类
String
代表字符串,Java程序中的所有字符串字面值(如“abc”)都作为此类的实例出现
String是一个final类,代表不可变的字符序列
字符串是常量,用引号引起来表示。他们的值在创建之后不能更改。
String对象的字符内容是存储在一个字符数组value[]中,private final char value[];
String:字符串,使用一对""引起来表示。
String声明为final的,不可被继承
String实现了Serializable接口:表示字符串是支持序列化的。
实现了Comparable接口:表示String可以比较大小
String内部定义了final char[] value用于存储字符串数据
String:代表不可变的字符序列。简称:不可变性。
体现:
- 当对字符串重新赋值时,需要重写指定内存区域赋值,不能使用原有的value进行赋值。
- 当对现有的字符串进行连接操作时,也需要重新指定内存区域赋值,不能使用原有的value进行赋值。
- 当调用String的replace()方法修改指定字符或字符串时,也需要重新指定内存区域赋值,不能使用原有的value进行赋值。
- 通过字面量的方式(区别于new)给一个字符串赋值,此时的字符串值声明在字符串常量池中。
字符串常量池中是不会存储相同内容的字符串的。
String的实例化方式:
方式一:通过字面量定义的方式
方式二:通过new + 构造器的方式
面试题:String s = new String(“abc”);方式创建对象,在内存中创建了几个对象?
两个:一个是堆空间中new结构,另一个是char[]对应的常量池中的数据:“abc”
//this.value = "".value;
//this.value = new char[0];
String s1 = new String();
//字符串常量池
String s2 = "abc";
//this.value = original.value;
String s3 = new String(s2);
char ch[] = {'a','b','c'};
//this.value = Arrays.copyOf(value, value.length);
String s4 = new String(ch);
常量池创建:
存储位置:
String构造方法参数类型是引用类型时,不一定指向常量池,平时使用比较多的是new Stirng(“abc”);这样的结构,而char ch[] = {‘a’,‘b’,‘c’};new String(ch);ch指向堆空间。不要误以为了。
String s1 = “abc” 和 new String(“abc”)
value:private final char value[];
字符串常量存储在字符串常量池,目的是共享
字符串非常量对象存储在堆中。
注意这两句话中的常量,我们总是以为常量就是字面直接能看出来的,比如1,2,3等,但其实这是不严谨的。
看下面:
@Test
public void run01(){
String s1 = "abc";
String s5 = s1 + "cd";
String s6 = "abccd";
System.out.println(s5 == s6);//false
}
@Test
public void run01(){
fianl String s1 = "abc";
String s5 = s1 + "cd";
String s6 = "abccd";
System.out.println(s5 == s6);//true
}
结论:
常量与常量的拼接结果在常量池。且常量池中不会存在相同内容的常量。
只要其中有一个是变量,结果就在堆中
如果拼接的结果调用intern()方法,返回值就在常量池中
注意
JDK1.6及以前,调用String.intern(),如果常量池中没有,则拷贝一份对象,放到常量池中。
JDK1.7及以后,调用String.intern(),如果常量池中没有,则拷贝一份引用,放到常量池中。
char ch[] = {'a','b','c'};
String s = new String(ch);
System.out.println(s.intern() == s);//true
String类常用方法
- int length():返回字符串的长度: return value.length
- char charAt(int index): 返回某索引处的字符return value[index]
- boolean isEmpty():判断是否是空字符串:return value.length == 0
- String toLowerCase():使用默认语言环境,将 String 中的所有字符转换为小写
- String toUpperCase():使用默认语言环境,将 String 中的所有字符转换为大写
- String trim():返回字符串的副本,忽略前导空白和尾部空白
- boolean equals(Object obj):比较字符串的内容是否相同
- boolean equalsIgnoreCase(String anotherString):与equals方法类似,忽略大小写
- String concat(String str):将指定字符串连接到此字符串的结尾。 等价于用“+”
- int compareTo(String anotherString):比较两个字符串的大小
- String substring(int beginIndex):返回一个新的字符串,它是此字符串的从beginIndex开始截取到最后的一个子字符串。
- String substring(int beginIndex, int endIndex) :返回一个新字符串,它是此字符串从beginIndex开始截取到endIndex(不包含)的一个子字符串
- boolean endsWith(String suffix):测试此字符串是否以指定的后缀结束
- boolean startsWith(String prefix):测试此字符串是否以指定的前缀开始
- boolean startsWith(String prefix, int toffset):测试此字符串从指定索引开始的子字符串是否以指定前缀开始
- boolean contains(CharSequence s):当且仅当此字符串包含指定的 char 值序列时,返回 true
- int indexOf(String str):返回指定子字符串在此字符串中第一次出现处的索引
- int indexOf(String str, int fromIndex):返回指定子字符串在此字符串中第一次出现处的索引,从指定的索引开始
- int lastIndexOf(String str):返回指定子字符串在此字符串中最右边出现处的索引
- int lastIndexOf(String str, int fromIndex):返回指定子字符串在此字符串中最后一次出现处的索引,从指定的索引开始反向搜索 注:indexOf和lastIndexOf方法如果未找到都是返回-1
- String replace(char oldChar, char newChar):返回一个新的字符串,它是通过用 newChar 替换此字符串中出现的所有 oldChar 得到的。
- String replace(CharSequence target, CharSequence replacement):使用指定的字面值替换序列替换此字符串所有匹配字面值目标序列的子字符串。
- String replaceAll(String regex, String replacement) : 使 用 给 定 的replacement 替换此字符串所有匹配给定的正则表达式的子字符串。
- String replaceFirst(String regex, String replacement) : 使 用 给 定 的replacement 替换此字符串匹配给定的正则表达式的第一个子字符串。
- boolean matches(String regex):**告知此字符串是否匹配给定的正则表达式。 **
- String[] split(String regex):根据给定正则表达式的匹配拆分此字符串。
- String[] split(String regex, int limit):根据匹配给定的正则表达式来拆分此字符串,最多不超过limit个,如果超过了,剩下的全部都放到最后一个元素中。
String与字节数组转换
字节数组和字符串
String(byte[]):通过使用平台的默认字符集解码指定的 byte 数组,构造一个新的 String。
String(byte[],int offset,int length) **:**用指定的字节数组的一部分,即从数组起始位置offset开始取length个字节构造一个字符串对象。
字符串和字节数组
public byte[] getBytes() **:**使用平台的默认字符集将此 String 编码为byte 序列,并将结果存储到一个新的 byte 数组中
public byte[] getBytes(String charsetName) **:**使用指定的字符集将 此 String 编码到 byte 序列,并将结果存储到新的 byte 数组
@Test
public void run02() throws UnsupportedEncodingException {
byte by[] = "abc123中国".getBytes();
Arrays.toString(by);
String s1 = new String(by, "utf-8");
System.out.println(s1);//abc123中国
String s2 = new String(by, "gbk");
System.out.println(s2);//abc123涓浗 原因:编解码不一致
}
StringBuffer,StringBuilder
String、StringBuffer、StringBuilder三者的异同?
String:不可变的字符序列;底层使用char[]存储
StringBuffer:可变的字符序列;线程安全的,效率低;底层使用char[]存储
StringBuilder:可变的字符序列;jdk5.0新增的,线程不安全的,效率高;底层使用char[]存储
源码分析:
String str = new String();//char[] value = new char[0];
String str1 = new String("abc");//char[] value = new char[]{'a','b','c'};
StringBuffer sb1 = new StringBuffer();//char[] value = new char[16];底层创建了一个长度是16的数组。
System.out.println(sb1.length());//
sb1.append('a');//value[0] = 'a';
sb1.append('b');//value[1] = 'b';
StringBuffer sb2 = new StringBuffer("abc");//char[] value = new char["abc".length() + 16];
//问题1. System.out.println(sb2.length());//3
//问题2. 扩容问题:如果要添加的数据底层数组盛不下了,那就需要扩容底层的数组。
默认情况下,扩容为原来容量的2倍 + 2,同时将原有数组中的元素复制到新的数组中。
指导意义:开发中建议大家使用:StringBuffer(int capacity) 或 StringBuilder(int capacity)