第 5 讲:谈谈 String、StringBuffer、StringBuilder 的区别

String

String 提供了构造和管理字符串的各种基本逻辑。它是典型的 Immutable被声明成为 final class,所有属性也都是 final 的也由于它的不可变性,类似拼接、裁剪字符串等动作,都会产生新的 String 对象。由于字符串操作的普遍性,所以相关操作的效率往往对应用性能有明显影响。

  • String 的创建机理

由于 String 在 Java 中使用过于频繁,Java 为了避免在一个系统中产生大量的 String 对象,引入了字符串常量池。其运行机制是:创建一个字符串时,首先检查池中是否有值相同的字符串对象,如果有则不需要创建直接从池中刚查找到的对象引用;如果没有则新建字符串对象,返回对象引用,并且将新创建的对象放入池中。但是,通过 new 方法创建的 String 对象是不检查字符串池的,而是直接在堆区或栈区创建一个新的对象,也不会把对象放入池中。上述原则只适用于通过直接常量给 String 对象引用赋值的情况。

举个栗子:

String str1 = "123"; // 通过直接量赋值方式,放入字符串常量池
String str2 = new String(“123”); // 通过 new 方式赋值方式,不放入字符串常量池

注意:String 提供了 intern() 方法。当调用 intern 方法时,如果池已经包含一个等于此 String 对象的字符串(用 equals(Object) 方法确定),则返回池中的字符串。否则,将此 String 对象添加到池中,并返回此 String 对象的引用。

  • String 的特性

不可变。是指String对象一旦生成,则不能再对它进行改变。不可变的主要作用在于当一个对象需要被多线程共享,并且访问频繁时,可以省略同步和锁等待的时间,从而大幅度提高系统性能。不可变模式是一个可以提高多线程程序的性能,降低多线程程序复杂度的设计模式。

针对常量池的优化。当 2 个 String 对象拥有相同的值时,他们只引用常量池中的同一个拷贝。当同一个字符串反复出现时,这个技术可以大幅度节省内存空间。

 

StringBuffer

StringBuffer 是为解决字符串拼接产生太多中间对象的问题而提供的一个类,我们可以用 append 或者 add 方法,把字符串添加到已有序列的末尾或者指定位置。StringBuffer 本质是一个线程安全的可修改字符序列(char 类型的数组),它保证了线程安全,也随之带来了额外的性能开销,所以除非有线程安全的需要,不然还是推荐使用 StringBuilder。

 

StringBuilder

StringBuilder 本质是一个线程不安全的可修改字符序列(char 类型的数组),有效减小了开销,是绝大部分情况下进行字符串拼接的首选。

 

三者的应用场景:

在字符串内容不经常发生变化的业务场景优先使用 String 类。例如:常量声明、少量的字符串拼接操作等。如果有大量的字符串内容拼接,避免使用 String 与 String 之间的“+”操作,因为这样会产生大量无用的中间对象,耗费空间且执行效率低下(新建对象、回收对象花费大量时间)。

在频繁进行字符串的运算(如拼接、替换、删除等),并且运行在多线程环境下,建议使用 StringBuffer,例如 XML 解析、HTTP 参数解析与封装。

在频繁进行字符串的运算(如拼接、替换、删除等),并且运行在单线程环境下,建议使用StringBuilder,例如 SQL 语句拼装、JSON 封装等。

 

知识扩展:

  • String 是 Immutable 类的典型实现,原生的保证了基础线程安全,因为你无法对它内部数据进行任何修改,这种便利甚至体现在拷贝构造函数中,由于不可变,Immutable 对象在拷贝时不需要额外复制数据。
  • StringBuffer 的线程安全是通过把各种修改数据的方法都加上 synchronized 关键字实现的。
  • StringBuffer StringBuilder 底层都是利用可修改的(char)数组,二者都继承了 AbstractStringBuilder,里面包含了基本操作,区别仅在于最终的方法是否加了 synchronized
  • 二者内部数组构建时大小:初始字符串长度加 16(这意味着,如果没有构建对象时输入最初的字符串,那么初始值就是 16)。
  • 我们如果确定拼接会发生非常多次,而且大概是可预计的,那么就可以指定合适的大小,避免很多次扩容的开销。扩容会产生多重开销因为要抛弃原有数组,创建新的(可以简单认为是倍数)数组,还要进行 arraycopy。
  • 在运行时字符串的一些基础操作会直接利用 JVM 内部的 Intrinsic 机制,往往运行的就是特殊优化的本地代码,而根本就不是 Java 代码生成的字节码。Intrinsic 可以简单理解为,是一种利用 native 方式 hard-coded 的逻辑(使用本地的直接常量),算是一种特别的内联,很多优化还是需要直接使用特定的 CPU 指。
  • 在 Java 9 中引入了 Compact Strings 的设计,对字符串进行了改进。将数据存储方式从 char 数组,改变为一个 byte 数组加上一个标识编码的所谓 coder,并且将相关字符串操作类都进行了修改。另外,所有相关的 Intrinsic 之类也都进行了重写,以保证没有任何性能损失。当然,存储能力有所改变,原来 char 数组的实现,字符串的最大长度就是数组本身的长度限制,但是替换成 byte 数组,同样数组长度下,存储能力退化一倍

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值