理解Java String和String Pool

  

 要理解java中String的运作方式,必须明确一点:String是一个非可变类(immutable)。什么是非可变类呢?简单说来,非可变类的实例是不能被修改的,每个实例中包含的信息都必须在该实例创建的时候就提供出来,并且在对象的整个生存周期内固定不变。java为什么要把String设计为非可变类呢?你可以问问james Gosling:)。但是非可变类确实有着自身的优势,如状态单一,对象简单,便于维护。其次,该类对象对象本质上是线程安全的,不要求同步。此外用户可以共享非可变对象,甚至可以共享它们的内部信息。(详见《Effective java》item13)。String类在java中被大量运用,甚至在class文件中都有其身影,因此将其设计为简单轻便的非可变类是比较合适的。 
一、创建。
   好了,知道String是非可变类以后,我们可以进一步了解String的构造方式了。创建一个Stirng对象,主要就有以下两种方式:

java 代码 
   String str1 = newString("abc");     
    Stirng str2= "abc";
  

   虽然两个语句都是返回一个String对象的引用,但是jvm对两者的处理方式是不一样的。对于第一种,jvm会在内部维护的StringPooll中放入一个"abc"对象,并在heap中创建一个String对象,然后将该heap中对象的引用返回给用户。对于第二种,jvm首先会在内部维护的StringPool中通过String的equels方法查找是对象池中是否存放有该String对象,如果有,则返回已有的String对象给用户,而不会在heap中重新创建一个新的String对象;如果对象池中没有该String对象,jvm则创建新的String对象添加至StringPool中,将其引用返回给用户。注意:使用第一种方法创建对象时,jvm是会主动把该对象放到stringspool里面的。看下面的例子:

java 代码 
    String str1 = new String("abc"); //jvm在堆上创建一个String对象并在内部维护的stringspool中放入一个"abc"对象   
   
   //jvm在strings pool中能找到值为“abc”的字符串,将其引用直接返回给str2

    Stirng str2="abc";    
   
    if(str1 ==str2){
       System.out.println("str1 ==str2");    
   }else{    
       System.out.println("str1 !=str2");    
      
    //打印结果是 str1!= str2,因为前者指向heap中的对象,后者指向StringPool中的对象    
   
    String str3="abc";    
   //此时,jvm发现strings pool中已有“abc”对象了,因为“abc”equels“abc”    
   //因此直接返回str2指向的对象给str3,也就是说str2和str3是指向同一个对象的引用    
    if(str2 ==str3){    
       System.out.println("str2 ==str3");    
   }else{    
       System.out.println("str2 !=str3");    
      
    //打印结果为 str2== str3  

    再看下面的例子:

java 代码 
    String str1 = new String("abc"); //jvm在堆上创建一个String对象并在内部维护的StringPool中放入一个"abc"对象 
   
    str1 =str1.intern();

   //程序显式将str1引用由原来的指向heap中对象改为指向内部维护的strings pool中的对象。
   

   //执行完该语句后,str1原来指向的String对象已经成为垃圾对象了,随时会    
   //被GC收集。    
   
   //此时,str1指向stringspool中的"abc”对象,也就是说str2和str1引用着同一个对象。  
    Stirng str2="abc";    
   
    if(str1 ==str2){    
       System.out.println("str1 ==str2");    
   }else{    
       System.out.println("str1 !=str2");    
      
   //打印结果是 str1 ==str2   

  为什么jvm可以这样处理String对象呢?就是因为String的非可变性。既然所引用的对象一旦创建就永不更改,那么多个引用共用一个对象时互不影响。

  但是如果用+号来实现String的串接时:1)仅当+号两边均为字符串常量时,才将其+后的结果当做字符串常量,且该结果直接放入StringPool;2)若+号两边有一方为变量时,+后的结果即当做非字符串常量处理(等同于newString()的效果)。

二、串接(Concatenation)。
  java程序员应该都知道滥用String的串接操作符是会影响程序的性能的。性能问题从何而来呢?归根结底就是String类的非可变性。既然String对象都是非可变的,也就是对象一旦创建了就不能够改变其内在状态了,但是串接操作明显是要增长字符串的,也就是要改变String的内部状态,两者出现了矛盾。怎么办呢?要维护String的非可变性,只好在串接完成后新建一个String对象来表示新产生的字符串了。也就是说,每一次执行串接操作都会导致新对象的产生,如果串接操作执行很频繁,就会导致大量对象的创建,性能问题也就随之而来了。
  为了解决这个问题,jdk为String类提供了一个可变的配套类,StringBuffer。使用StringBuffer对象,由于该类是可变的,串接时仅仅时改变了内部数据结构,而不会创建新的对象,因此性能上有很大的提高。针对单线程,jdk5.0还提供了StringBuilder类,在单线程环境下,由于不用考虑同步问题,使用该类使性能得到进一步的提高。

三、String的长度
  我们可以使用串接操作符得到一个长度更长的字符串,那么,String对象最多能容纳多少字符呢?查看String的源代码我们可以得知类String中是使用域count 来记录对象字符的数量,而count 的类型为 int,因此,我们可以推测最长的长度为2^32,也就是4G。
   不过,我们在编写源代码的时候,如果使用 Sting str= "aaaa";的形式定义一个字符串,那么双引号里面的ASCII字符最多只能有 65534个。为什么呢?因为在class文件的规范中,CONSTANT_Utf8_info表中使用一个16位的无符号整数来记录字符串的长度的,最多能表示 65536个字节,而javaclass 文件是使用一种变体UTF-8格式来存放字符的,null值使用两个字节来表示,因此只剩下 65536- 2 =65534个字节。也正是变体UTF-8的原因,如果字符串中含有中文等非ASCII字符,那么双引号中字符的数量会更少(一个中文字符占用三个字节)。如果超出这个数量,在编译的时候编译器会报错。

转自:http://hi.baidu.com/hannick/blog/item/30fa29006e614f077bec2c18.html
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值