JVM之String
一,String的概述
String的基本特性:
- String声明为final的,不可被继承;实现了Serializable接口:表示字符串是支持序列化的,实现了Comparable接口:表示String可以比较大小
- String在jdk8及以前内部定义了final char[] value用于存储字符串数据,jdk9时改为byte[],(为了节省空间,在官方文档中提到:大部分的字符串都只需一个字节存储就可以,而char有两个字节的空间,另一个字节就是空闲的,而且堆中字符串占主要的部分,所以修改后可以极大的节省空间)
- String代表不可变的字符序列
- 当对字符串重新赋值时,需要重写指定内存区域赋值,不能使用原有的value进行赋值
- 当对现有的字符串进行连接操作时,也需要重新指定内存区域赋值,不能使用原有的value进行赋值
- 当调用String的replace()方法修改指定字符或字符串时,也需要重新指定内存区域赋值,不能使用原有的value进行赋值
- 通过字面量的方式给一个字符串赋值,此时的字符串值声明在字符串常量池中。
字符串常量池:
字符串常量池是不会存储相同内容的字符串的
String的String Pool是一个固定大小的Hashtable,默认值大小长度是1009,如果放进去String Pool的String非常多,就会造成Hash冲突严重,从而导致链表会很长,链表长了之后会直接造成的影响就是当调用String.intern时性能会大幅下降
使用-XX:StringTableSize可设置StringTable的长度
在jdk6中StringTable是固定的就是1009的长度,所以如果常量池中的字符串过多就会导致效率下降很快,StringTableSize设置没有要求;在jdk7中,StringTable的长度默认值是60013,jdk8开始,设置StringTable的长度的话,1009是可设置的最小值。
String的内存分配:
常量池类似于一个Java系统级别提供的缓存,8种基本数据类型的常量池就是系统协调的,String类型的常量池比较特殊,主要有两种方式:
1)直接使用引号声明,string对象会直接存储在常量池种
2)如果不是使用引号声明,可以使用String提供的intern()方法。
string内存分配的变化:
Java6以前,字符串常量池存放在永久代
Java7中,字符串常量池的位置调整到Java堆中,优点有以下两点:
1)所有的字符串都存放在堆中,和其他普通对象一样,可以在进行调优应用时仅需调整堆大小就可以了。
2)这个改变可以让我们多多考虑使用String.intern()
java8,永久代变为元空间,字符常量在堆
二,String的基本操作
Java语言规范中要求完全相同的字符串字面量,应该包含同样的Unicode字符序列(包含同一份码点序列的常量),并且必须是指向同一个String类实例。
所以用=赋值时,如果常量池中不存在就创建一个放在常量池中,将该引用返回,如果常量池中存在,就直接将存在的引用返回
字符串拼接操作:
- 常量的拼接结果在常量池,原理是编译器优化
- 常量池中不会存在相同内容的常量
- 只要其中有一个是变量,结果就在堆中,变量拼接的原理是StringBuilder
- 如果拼接的结果调用intern()方法,则主动将常量池中还没有的字符串对象放入池中,并返回对象地址。
例:
string s1="a";
string s2="b";
String s=s1+s2;
执行细节如下:
1)StringBuilder s=new StringBuilder();
2)s.append("a");
3)s.append("b");
4)s.toString()----->类似于new string("ab")
intern()的使用
intern方法会从字符串常量池中查询当前字符串是否存在,若不存在就会将当前字符串放入常量池中。
String myinfo=new String(“aa”).intern();
intern方法确保字符串在内存中只有一份拷贝,这样可以节约内存空间,加快字符串操作任务的执行速度。这个值会被放在字符串内部池(String Intern Pool)
如何保证变量s指向字符串常量池中的数据呢?
方式一:String s=“aa”;
方式二:调用intern()方法
例:
new String("a")+new String("b")//这句代码内部生成了几个对象
内部解析:
对象1:new StriingBuilder()
对象2:new String("a")
对象3:常量池中的"a"
对像4:new String("b")
对象5:常量池中的“b”
字符串拼接最后StringBuilder会调用toString()
对象6:new String("ab")
toStriing()的调用,在字符串常量池中,没有生成"ab"
练习题:
(1)
(2)
总结:String的intern()的使用
jdk1.6中,将这个字符串对象尝试放入串池
如果串池中有,则不会放入,返回已有的串池中的对象地址
如果没有,会把此对象复制一份,放入串池,并返回串池中的对象地址
jdk1.7后,将这个字符串尝试放入串池
如果串池有,则并不会放入,返回已有的串池中的对象的地址
如果没有,则会把对象的引用地址复制一份,放入串池,并返回串池中的引用地址。
使用intern()测试执行效率,从时间和空间上来看,使用intern()大大降低了时间和空间,因为使用intern()GC会进行垃圾回收,释放空间
大的网站平台,需要内存中存储大量的字符串,比如社交网络,这时候如果字符串都调用intern()方法,就会明显降低内存的大小
String的垃圾回收设置参数:
-Xms15m -Xmx15m -XX:+PrintStringTableStatistics -XX:+PrintGCDetails