String

最新推荐文章于 2022-10-21 16:50:44 发布

Noble-H

最新推荐文章于 2022-10-21 16:50:44 发布

阅读量301

点赞数

分类专栏：开发语言 Java

开发语言 Java 专栏收录该内容

28 篇文章 0 订阅

订阅专栏

一、基本方法

concat方法

该方法的作用是进行字符串的连接，将两个字符串连接以后形成一个新的字符串。例如：

String s = “abc”;

String s1 = “def”;

String s2 = s.concat(s1);

则连接以后生成的新字符串s2的值是”abcdef”，而字符串s和s1的值不发生改变。如果需要连接多个字符串，可以使用如下方法：

String s = “abc”;

String s1 = “def”;

String s2 = “1234”;

String s3 = s.concat(s1).concat(s2);

则生成的新字符串s3的值为”abcdef1234”。

其实在实际使用时，语法上提供了一种更简单的形式，就是使用“+”进行字符串的连接。例如：

String s = “abc” + “1234”;

则字符串s的值是”abc1234”，这样书写更加简单直观。

而且使用“+”进行连接，不仅可以连接字符串，也可以连接其他类型。但是要求进行连接时至少有一个参与连接的内容是字符串类型。而且“+”匹配的顺序是从左向右，如果两边连接的内容都是基本数字类型则按照加法运算，如果参与连接的内容有一个是字符串才按照字符串进行连接。

例如：

int a = 10;

String s = “123” + a + 5;

则连接以后字符串s的值是“123105”，计算的过程为首先连接字符串”123”和变量a的值，生成字符串”12310”，然后使用该字符串再和数字5进行连接生成最终的结果。

endsWith方法

该方法的作用是判断字符串是否以某个字符串结尾，如果以对应的字符串结尾，则返回true。

例如：

String s = “student.doc”;

boolean b = s.endsWith(“doc”);

则变量b的值是true。

getBytes方法

该方法的作用是将字符串转换为对应的byte数组，从而便于数据的存储和传输。例如：

String s = “计算机”;

byte[] b = s.getBytes(); //使用本机默认的字符串转换为byte数组

byte[] b = s.getBytes(“gb2312”); //使用gb2312字符集转换为byte数组

在实际转换时，一定要注意字符集的问题，否则中文在转换时将会出现问题。

indexOf方法

该方法的作用是查找特定字符或字符串在当前字符串中的起始位置，如果不存在则返回-1。例如：

String s = “abcded”;

int index = s.indexOf(‘d’);

int index1 = s.indexOf(‘h’);

则返回字符d在字符串s中第一次出现的位置，数值为3。由于字符h在字符串s中不存在，则index1的值是-1。

当然，也可以从特定位置以后查找对应的字符，例如：

int index = s.indexOf(‘d’,4);

则查找字符串s中从索引值4(包括4)以后的字符中第一个出现的字符d，则index的值是5。

由于indexOf是重载的，也可以查找特定字符串在当前字符串中出现的起始位置，使用方式和查找字符的方式一样。

另外一个类似的方法是lastIndexOf方法，其作用是从字符串的末尾开始向前查找第一次出现的规定的字符或字符串，例如：

String s = “abcded”;

int index = s. lastIndexOf(‘d’);

则index的值是5。

length方法

该方法的作用是返回字符串的长度，也就是返回字符串中字符的个数。中文字符也是一个字符。例如：

String s = “abc”;

String s1 = “Java语言”;

int len = s.length();

int len1 = s1.length();

则变量len的值是3，变量len1的值是6。

replace方法

该方法的作用是替换字符串中所有指定的字符，然后生成一个新的字符串。经过该方法调用以后，原来的字符串不发生改变。例如：

String s = “abcat”;

String s1 = s.replace(‘a’,’1’);

该代码的作用是将字符串s中所有的字符a替换成字符1，生成的新字符串s1的值是”1bc1t”，而字符串s的内容不发生改变。

如果需要将字符串中某个指定的字符串替换为其它字符串，则可以使用replaceAll方法，例如：

String s = “abatbac”;

String s1 = s.replaceAll(“ba”,”12”);

该代码的作用是将字符串s中所有的字符串”ab”替换为”12”，生成新的字符串”a12t12c”，而字符串s的内容也不发生改变。

如果只需要替换第一个出现的指定字符串时，可以使用replaceFirst方法，例如：

String s = “abatbac”;

String s1 = s. replaceFirst (“ba”,”12”);

该代码的作用是只将字符串s中第一次出现的字符串”ab”替换为字符串”12”，则字符串s1的值是”a12tbac”，字符串s的内容也不发生改变。

split方法

该方法的作用是以特定的字符串作为间隔，拆分当前字符串的内容，一般拆分以后会获得一个字符串数组。例如：

String s = “ab,12,df”;

String s1[] = s.split(“,”);

该代码的作用是以字符串”,”作为间隔，拆分字符串s，从而得到拆分以后的字符串数字s1，其内容为：{“ab”,”12”,”df”}。

该方法是解析字符串的基础方法。

如果字符串中在内部存在和间隔字符串相同的内容时将拆除空字符串，尾部的空字符串会被忽略掉。例如：

String s = “abbcbtbb”;

String s1[] = s.split(“b”);

则拆分出的结果字符串数组s1的内容为：{“a”,””,”c”,”t”}。拆分出的中间的空字符串的数量等于中间间隔字符串的数量减一个。例如：

String s = “abbbcbtbbb”;

String s1[] = s.split(“b”);

则拆分出的结果是：{“a”,””,””,”c”,”t”}。最后的空字符串不论有多少个，都会被忽略。

如果需要限定拆分以后的字符串数量，则可以使用另外一个split方法，例如：

String s = “abcbtb1”;

String s1[] = s.split(“b”,2);

该代码的作用是将字符串s最多拆分成包含2个字符串数组。则结果为：{“a”,”cbtb1”}。

如果第二个参数为负数，则拆分出尽可能多的字符串，包括尾部的空字符串也将被保留。

substring方法

该方法的作用是取字符串中的“子串”，所谓“子串”即字符串中的一部分。例如“23”是字符串“123”的子串。

字符串“123”的子串一共有6个：”1”、”2”、”3”、”12”、”23”、”123”。而”32”不是字符串”123”的子串。

例如：

String s = “Test”;

String s1 = s.substring(2);

则该代码的作用是取字符串s中索引值为2(包括)以后的所有字符作为子串，则字符串s1的值是”st”。

如果数字的值和字符串的长度相同，则返回空字符串。例如：

String s = “Test”;

String s1 = s.substring(4);

则字符串s1的值是””。

如果需要取字符串内部的一部分，则可以使用带2个参数的substring方法，例如：

String s = “TestString”;

String s1 = s.substring(2,5);

则该代码的作用是取字符串s中从索引值2(包括)开始，到索引值5(不包括)的部分作为子串，则字符串s1的值是”stS”。

下面是一个简单的应用代码，该代码的作用是输出任意一个字符串的所有子串。代码如下：

String s = “子串示例”;

int len = s.length(); //获得字符串长度

for(int begin = 0;begin < len – 1;begin++){ //起始索引值

for(int end = begin + 1;end <= len;end++){ //结束索引值

System.out.println(s.substring(begin,end));

}

在该代码中，循环变量begin代表需要获得的子串的起始索引值，其变化的区间从第一个字符的索引值0到倒数第二个字符串的索引值len -2，而end代表需要获得的子串的结束索引值，其变化的区间从起始索引值的后续一个到字符串长度。通过循环的嵌套，可以遍历字符串中的所有子串。

trim方法

该方法的作用是去掉字符串开始和结尾的所有空格，然后形成一个新的字符串。该方法不去掉字符串中间的空格。例如：

String s = “ abc abc 123 “;

String s1 = s.trim();

则字符串s1的值为：”abc abc 123”。字符串s的值不变。

valueOf方法

该方法的作用是将其它类型的数据转换为字符串类型。需要注意的是，基本数据和字符串对象之间不能使用以前的强制类型转换的语法进行转换。

另外，由于该方法是static方法，所以不用创建String类型的对象即可。例如：

int n = 10;

String s = String.valueOf(n);

则字符串s的值是”10”。虽然对于程序员来说，没有发生什么变化，但是对于程序来说，数据的类型却发生了变化。

介绍一个简单的应用，判断一个自然数是几位数字的逻辑代码如下：

int n = 12345;

String s = String.valueOf(n);

int len = s.length();

则这里字符串的长度len，就代表该自然数的位数。这种判断比数学判断方法在逻辑上要简单一些。

equals方法

该方法的作用是判断两个字符串对象的内容是否相同。如果相同则返回true，否则返回false。例如：

String s = “abc”;

String s1 = new String(“abc”);

boolean b = s.equals(s1);

而使用“==”比较的是两个对象在内存中存储的地址是否一样。例如上面的代码中，如果判断：

boolean b = (s == s1);

则变量b的值是false，因为s对象对应的地址是”abc”的地址，而s1使用new关键字申请新的内存，所以内存地址和s的”abc”的地址不一样，所以获得的值是false。

在String类中存在一个类似的方法equalsIgnoreCase，该方法的作用是忽略大小写比较两个字符串的内容是否相同。例如：

String s = “abc”;

String s1 =”ABC”;

boolean b = s. equalsIgnoreCase (s1);

则变量b的值是true。

二、案例解析

public static void main(String[] args) {
/**
* 情景一：字符串池
* JAVA虚拟机(JVM)中存在着一个字符串池，其中保存着很多String对象;
* 并且可以被共享使用，因此它提高了效率。
* 由于String类是final的，它的值一经创建就不可改变。
* 字符串池由String类维护，我们可以调用intern()方法来访问字符串池。
*/
String s1 = "abc";
//↑ 在字符串池创建了一个对象
String s2 = "abc";
//↑ 字符串pool已经存在对象“abc”(共享),所以创建0个对象，累计创建一个对象
System.out.println("s1 == s2 : "+(s1==s2));
//↑ true 指向同一个对象，
System.out.println("s1.equals(s2) : " + (s1.equals(s2)));
//↑ true 值相等
//↑------------------------------------------------------over
/**
* 情景二：关于new String("")
*
*/
String s3 = new String("abc");
//↑ 创建了两个对象，一个存放在字符串池中，一个存在与堆区中；
//↑ 还有一个对象引用s3存放在栈中
String s4 = new String("abc");
//↑ 字符串池中已经存在“abc”对象，所以只在堆中新创建了一个对象
System.out.println("s3 == s4 : "+(s3==s4));
//↑false s3和s4栈区的地址不同，指向堆区的不同地址；
System.out.println("s3.equals(s4) : "+(s3.equals(s4)));
//↑true s3和s4的值相同
System.out.println("s1 == s3 : "+(s1==s3));
//↑false 存放的地区多不同，一个栈区，一个堆区
System.out.println("s1.equals(s3) : "+(s1.equals(s3)));
//↑true 值相同
//↑------------------------------------------------------over
/**
* 情景三：
* 由于常量的值在编译的时候就被确定(优化)了。
* 在这里，"ab"和"cd"都是常量，因此变量str3的值在编译时就可以确定。
* 这行代码编译后的效果等同于： String str3 = "abcd";
*/
String str1 = "ab" + "cd"; //1个对象
String str11 = "abcd";
System.out.println("str1 = str11 : "+ (str1 == str11)); true
//↑------------------------------------------------------over
/**
* 情景四：
* 局部变量str2,str3存储的是存储两个拘留字符串对象(intern字符串对象)的地址。
*
* 第三行代码原理(str2+str3)：
* 运行期JVM首先会在堆中创建一个StringBuilder类，
* 同时用str2指向的拘留字符串对象完成初始化，
* 然后调用append方法完成对str3所指向的拘留字符串的合并，
* 接着调用StringBuilder的toString()方法在堆中创建一个String对象，
* 最后将刚生成的String对象的堆地址存放在局部变量str3中。
*
* 而str5存储的是字符串池中"abcd"所对应的拘留字符串对象的地址。
* str4与str5地址当然不一样了。
*
* 内存中实际上有五个字符串对象：
* 三个拘留字符串对象、一个String对象和一个StringBuilder对象。
*/
String str2 = "ab"; //1个对象
String str3 = "cd"; //1个对象
String str4 = str2+str3;
String str5 = "abcd";
System.out.println("str4 = str5 : " + (str4==str5)); // false
//↑------------------------------------------------------over
/**
* 情景五：
* JAVA编译器对string + 基本类型/常量是当成常量表达式直接求值来优化的。
* 运行期的两个string相加，会产生新的对象的，存储在堆(heap)中
*/
String str6 = "b";
String str7 = "a" + str6;
String str67 = "ab";
System.out.println("str7 = str67 : "+ (str7 == str67)); false
//↑str6为变量，在运行期才会被解析。
final String str8 = "b";
String str9 = "a" + str8;
String str89 = "ab";
System.out.println("str9 = str89 : "+ (str9 == str89)); true
//↑str8为常量变量，编译期会被优化
//↑------------------------------------------------------over
}

下面是一些String相关的常见问题：

　　String中的final用法和理解
　　final StringBuffer a = new StringBuffer("111");
　　final StringBuffer b = new StringBuffer("222");
　　a=b;//此句编译不通过 final StringBuffer a = new StringBuffer("111");
　　a.append("222");// 编译通过

　　可见，final只对引用的"值"(即内存地址)有效，它迫使引用只能指向初始指向的那个对象，改变它的指向会导致编译期错误。至于它所指向的对象的变化，final是不负责的。

2.代码中的字符串常量在编译的过程中收集并放在class文件的常量区中，如"123"、"123"+"456"等，含有变量的表达式不会收录，如"123"+a。

3.JVM在加载类的时候，根据常量区中的字符串生成常量池，每个字符序列如"123"会生成一个实例放在常量池里，这个实例是不在堆里的，也不会被GC，这个实例的value属性从源码的构造函数看应该是用new创建数组置入123的，所以按我的理解此时value存放的字符数组地址是在堆里，如果有误的话欢迎大家指正。

4.使用String不一定创建对象

在执行到双引号包含字符串的语句时，如String a = "123"，JVM会先到常量池里查找，如果有的话返回常量池里的这个实例的引用，否则的话创建一个新实例并置入常量池里。如果是 String a = "123" + b (假设b是"456")，前半部分"123"还是走常量池的路线，但是这个+操作符其实是转换成[SringBuffer].Appad()来实现的，所以最终a得到是一个新的实例引用，而且a的value存放的是一个新申请的字符数组内存空间的地址(存放着"123456")，而此时"123456"在常量池中是未必存在的。

要注意: 我们在使用诸如String str = "abc"；的格式定义类时，总是想当然地认为，创建了String类的对象str。担心陷阱！对象可能并没有被创建！而可能只是指向一个先前已经创建的对象。只有通过new()方法才能保证每次都创建一个新的对象

5.使用new String，一定创建对象

在执行String a = new String("123")的时候，首先走常量池的路线取到一个实例的引用，然后在堆上创建一个新的String实例，走以下构造函数给value属性赋值，然后把实例引用赋值给a：

public String(String original) {
    int size = original.count;
    char[] originalValue = original.value;
    char[] v;
      if (originalValue.length > size) {
         // The array representing the String is bigger than the new
         // String itself.  Perhaps this constructor is being called
         // in order to trim the baggage, so make a copy of the array.
            int off = original.offset;
            v = Arrays.copyOfRange(originalValue, off, off+size);
     } else {
         // The array representing the String is the same
         // size as the String, so no point in making a copy.
        v = originalValue;
     }
    this.offset = 0;
    this.count = size;
    this.value = v;
    }

从中我们可以看到，虽然是新创建了一个String的实例，但是value是等于常量池中的实例的value，即是说没有new一个新的字符数组来存放"123"。

如果是String a = new String("123"+b)的情况，首先看回第4点，"123"+b得到一个实例后，再按上面的构造函数执行。

6.String.intern()

String对象的实例调用intern方法后，可以让JVM检查常量池，如果没有实例的value属性对应的字符串序列比如"123"(注意是检查字符串序列而不是检查实例本身)，就将本实例放入常量池，如果有当前实例的value属性对应的字符串序列"123"在常量池中存在，则返回常量池中"123"对应的实例的引用而不是当前实例的引用，即使当前实例的value也是"123"。

public native String intern();

存在于.class文件中的常量池，在运行期被JVM装载，并且可以扩充。String的 intern()方法就是扩充常量池的一个方法；当一个String实例str调用intern()方法时，Java 查找常量池中是否有相同Unicode的字符串常量，如果有，则返回其的引用，如果没有，则在常量池中增加一个Unicode等于str的字符串并返回它的引用；看示例就清楚了

public static void main(String[] args) {
        String s0 = "kvill"; 
        String s1 = new String("kvill"); 
        String s2 = new String("kvill"); 
        System.out.println( s0 == s1 ); //false
        System.out.println( "**********" ); 
        s1.intern(); //虽然执行了s1.intern(),但它的返回值没有赋给s1
        s2 = s2.intern(); //把常量池中"kvill"的引用赋给s2 
        System.out.println( s0 == s1); //flase
        System.out.println( s0 == s1.intern() ); //true//说明s1.intern()返回的是常量池中"kvill"的引用
        System.out.println( s0 == s2 ); //true
    }

最后我再破除一个错误的理解：有人说，“使用 String.intern() 方法则可以将一个 String 类的保存到一个全局 String 表中，如果具有相同值的 Unicode 字符串已经在这个表中，那么该方法返回表中已有字符串的地址，如果在表中没有相同值的字符串，则将自己的地址注册到表中”如果我把他说的这个全局的 String 表理解为常量池的话，他的最后一句话，”如果在表中没有相同值的字符串，则将自己的地址注册到表中”是错的：

public static void main(String[] args) {        
        String s1 = new String("kvill"); 
        String s2 = s1.intern(); 
        System.out.println( s1 == s1.intern() ); //false
        System.out.println( s1 + " " + s2 ); //kvill kvill
        System.out.println( s2 == s1.intern() ); //true
    }

在这个类中我们没有声名一个”kvill”常量，所以常量池中一开始是没有”kvill”的，当我们调用s1.intern()后就在常量池中新添加了一个”kvill”常量，原来的不在常量池中的”kvill”仍然存在，也就不是“将自己的地址注册到常量池中”了。

　　s1==s1.intern() 为false说明原来的”kvill”仍然存在；s2现在为常量池中”kvill”的地址，所以有s2==s1.intern()为true。

StringBuffer与StringBuilder的区别，它们的应用场景是什么？

jdk的实现中StringBuffer与StringBuilder都继承自AbstractStringBuilder，对于多线程的安全与非安全看到StringBuffer中方法前面的一堆synchronized就大概了解了。

这里随便讲讲AbstractStringBuilder的实现原理：我们知道使用StringBuffer等无非就是为了提高java中字符串连接的效率，因为直接使用+进行字符串连接的话，jvm会创建多个String对象，因此造成一定的开销。AbstractStringBuilder中采用一个char数组来保存需要append的字符串，char数组有一个初始大小，当append的字符串长度超过当前char数组容量时，则对char数组进行动态扩展，也即重新申请一段更大的内存空间，然后将当前char数组拷贝到新的位置，因为重新分配内存并拷贝的开销比较大，所以每次重新申请内存空间都是采用申请大于当前需要的内存空间的方式，这里是2倍

【

    StringBuffer 始于 JDK 1.0
    StringBuilder 始于 JDK 1.5

    从 JDK 1.5 开始，带有字符串变量的连接操作（+），JVM 内部采用的是
    StringBuilder 来实现的，而之前这个操作是采用 StringBuffer 实现的。

】

我们通过一个简单的程序来看其执行的流程：

public class Buffer {  
     public static void main(String[] args) {  
            String s1 = "aaaaa";  
            String s2 = "bbbbb";  
            String r = null;  
            int i = 3694;  
            r = s1 + i + s2;   
              
            for(int j=0;i<10;j++){  
                r+="23124";  
            }  
     }  
}

使用命令javap -c Buffer查看其字节码实现：

将清单1和清单2对应起来看，清单2的字节码中ldc指令即从常量池中加载“aaaaa”字符串到栈顶，istore_1将“aaaaa”存到变量1中，后面的一样，sipush是将一个短整型常量值(-32768~32767)推送至栈顶，这里是常量“3694”，更多的Java指令集请查看另一篇文章“Java指令集”。

让我们直接看到13,13~17是new了一个StringBuffer对象并调用其初始化方法，20~21则是先通过aload_1将变量1压到栈顶，前面说过变量1放的就是字符串常量“aaaaa”，接着通过指令invokevirtual调用StringBuffer的append方法将“aaaaa”拼接起来，后续的24~30同理。最后在33调用StringBuffer的toString函数获得String结果并通过astore存到变量3中。

看到这里可能有人会说，“既然JVM内部采用了StringBuffer来连接字符串了，那么我们自己就不用用StringBuffer，直接用”+“就行了吧！“。是么？当然不是了。俗话说”存在既有它的理由”，让我们继续看后面的循环对应的字节码。

37~42都是进入for循环前的一些准备工作，37,38是将j置为1。44这里通过if_icmpge将j与10进行比较，如果j大于10则直接跳转到73，也即return语句退出函数；否则进入循环，也即47~66的字节码。这里我们只需看47到51就知道为什么我们要在代码中自己使用StringBuffer来处理字符串的连接了，因为每次执行“+”操作时jvm都要new一个StringBuffer对象来处理字符串的连接，这在涉及很多的字符串连接操作时开销会很大。