一、String的基本特性
- String 字符串,用""引起来表示
- String s1 = "G1";
- String s2 = new String("G1");
- String 生命为final,不可被继承
- String 实现序列化接口(Serializable)、可排序Conparable<String>、CharSequence
- jdk1.8 使用char数组进行存储,jdk1.9之后使用byte数组进行存储
- String堆空间主要部分,用char存储比用byte存储浪费空间
- StringBuffer、StringBuild都会修改
- String 不可变的字符序列,不可变性
- 字面量定义的方式,存储在字符串常量池中,但是在字符串常量池中,不能存在相同的内容,所以String s1="abc"和String s2="abc",使用的是字符串常量池中的相同字符串对象
- 在一个字符串上拼接,会重新创建,String s1="abc",拼接s1+="def",不是在abc后面拼接而是重新创建一个 abcdef字符串
- 在现有的字符串修改某个字符,还是会重新创建一个字符串
字符创常量池中不会存储相同内容的字符串
- String的String pool是一个固定大小的Hashtable,默认长度是1009。如果放进String pool的String非常多,会超出Hash冲突严重,导致链表会很长,而链表长了后直接造成的影响就是调用String.intern时性能下降。
- 使用-XX:StringTableSize可以设置Stringtable长度
- 在jdk6以前,StringTable是固定的,就是1009的长度,所以如果常量池中的字符串过多,就会导致效率下降很快。StringTableSize设置没有要求
- jdk7中,StringTable的默认长度是60013
- jdk8以后,1009是可设置最小长度
二、String的内存分配
- java语言中有8中基本数据类型和一种比较特殊的类型String。这些类型为了使他们在运行过程中速度更快、更节省内存,都提供了一种常量池的概念
- 常量池就是类似于一个JAVA系统级别的缓存。8中数据类型常量池都是系统协调的,String类型的常量池比较特殊,主要方法有2中
- 直接使用双引号声明出来的String对象会直接存储在常量池中
- 其他方式使用Stirng的intern方法。
- jdk6方法在永久代、jdk7之后放在堆中
- 永久代很小
- GC不频繁
三、String的基本操作
- java语言要求,完全相同的字符串字面量,应该包含相同Unicode字符序列,并且必须指向相同String类实例
四、字符串拼接操作
- 常量与常量的拼接结果在常量池,原理是编译期优化
- 常量池中不会存在相同内容的常量
- 只要其中有一个是遍历,结果就在队中。变量拼接的原理是StringBuilder
- 如果拼接的结果调用intern()方法,则主动将常量池中还没有的字符串对象放入池中,并返回对象地址
- StringBuilder效率高的原因,String的变量拼接都会创建StringBuilder,在实际开发过程中,尽量使用定义StringBuilder的长度
五、intern()的使用
常量池存在返回引用,不存在创建字符串并返回引用。s1.intern()==s2.intern()等价于s1.equals(s2),initern 确保一个字符只有一个在常量池中。
new String("ab")会创建几个对象:2个,一个new对象在堆中,一个ab在常量池中
new String("a") + new String("b")会创建几个对象:
- 因为拼接操作 StringBuilder 第一个
- new String("a") 第二个
- a 第三个
- new String("b") 第四个
- b 第五个
- 最后拼接的 toString 中new String("ab") 第六个,但是在字符串常量池中没有生成ab
JDK7以后:字符串放在堆里面,当调用intern方法的时候,发现堆中存在 new String("11"),常量池中直接存放 new String("11")的引用,主要是节省空间
String.intern() 使用总结:
- 在jdk1.6中
- 如果常量池中存在,则不会放入,返回已有对象的地址
- 如果不存在,会把对象复制一份,放入常量池,并放回对象地址
- 在jdk1.7中
- 如果常量池中存在,则不会放入,返回已有对象的地址
- 如果不存在,会把对象的引用复制一份,放入常量池,并放回对象地址
其实主要是要看,常量池中保存的是对象的引用还是字符串对象。
六、StringTable的垃圾回收
String.intern()空间使用效率:使用它更节省内存空间。相差3倍左右。
七、G1中的String去重操作(非常量池,是堆中的String)
测试结果:
- 堆存活数据集合里面String约占25%
- 堆存活数据集合里面重复的String对象月有13.5%
- String 平均长度是45
根据以上数据,G1垃圾或受其自动持续的对重复String对象进行去重,避免内存浪费。