String 在Java中是使用很频繁的对象。
一,字符串的设计
1.String 为什么是final?
(1)安全性考虑:对于URL,或文件路径等被其他对象修改会造成影响。
(2)性能(效率)考虑:由于String的使用比较频繁,所以final设计保证hash码的唯一性,不需要每次重新计算hash值。不可变对象被多线程访共享,当大量访问的时候,节约了等待锁的时间和开销。
(3)设计因素:字符串常量池是Java对中的一片特殊存储区域,如果可以String可以修改,会造成相互影响。
2.字符串的设计和实现考量
String是Immutable类的典型实现,原生的保证了基础的线程安全,因为你无法对它累不数据进行任何修改,这种便利甚至体现在拷贝构造函数中,由于不可 变,Immutable对象在拷贝时不需要额外复制数据。
二 ,字符串缓存
把常见应用进行堆转储(Dump Heap),字符串对象占很大比例,大部分是重复的,如何可以避免重复创建字符串,可以有效的降低内存消耗和对象的开销
String Java1.6后提供了intern()方法,目的是提示JVM把相应的字符串缓存起来,已被重复使用。调用盖方法时候,如果常量池中有,则不需要创建,从常量池中直接引用,否则创建新的字符串对象,返回对象引用,并将创建的对象放入常量池中。一般使用Java 6这种历史版本,并不推荐大量使用intern,为什么呢?魔鬼存在于细节中,被缓存的字符串是存在所 谓PermGen里的,也就是臭名昭著的“永久代”,这个空间是很有限的,也基本不会被FullGC之外的垃圾收集照顾到。所以,如果使用不当,OOM就会光顾。在后续版本中,这个缓存被放置在堆中,这样就极大避免了永久代占满的问题,甚至永久代在JDK 8中被MetaSpace(元数据区)替代了。
String在Java1.9前是使用char来存储数据的, 在Java 9中,将数据存储方式从char数组,改变为一个byte数组加上一个标识编码的所谓coder,并且将 相关字符串操作类都进行了修改
StringBuilder和StringBuffer底层都是利用可修改的(char,JDK 9以后是byte)数组,二者都继承了AbstractStringBuilder,里面包含了基本 操作,区别仅在于最终的方法是否加了synchronized。StringBuilder是Java 1.5中新增的,在能力上和StringBufer没有本质区别,但是它去掉了线程安全的部分,有效减小了开销,是绝大部分情况下进行字符串拼接的首选。
扩展问题:对于敏感信息,为何使用char[]要比String更好?
String是不可变对象, 意思是一旦创建,那么整个对象就不可改变. 即使新手觉得String引用变了,实际上只是(指针)引用指向了另一个(新的)对象.而程序员可以明确地对字符数组进行修改,因此敏感信息(如密码)不容易在其他地方暴露(只要你用完后对char[]置0).
参考文献:https: //time.geekbang.org/column/intro/82