对于有些开发多年的程序员来说,他们码字的速度非常快,框架理解搭建的也非常好。但是如果问一些比较细的java问题的话你确定他们能回答得出来吗?
java的字符串存储在哪?
对于堆、栈和字符串常量池以及他们之间的关系,我是这样理解的。
首先介绍一下堆、栈、常量池中存放的数据类型吧。
堆:存放所有new出来的对象;
栈:存放基本数据变量和对象的引用,对象(new出来的对象)本身不存在在栈中,而是存放在堆中或者常量池中(字符串对象存放在常量池中);
常量池:存放基本类型常量和字符串常量。
对于栈和常量池中的对象可以共享,对于堆中的对象不可以共享。栈中的数据大小和生命周期是可以确定的,当没有引用指向数据时,数据就会自动消失。堆中的对象由垃圾回收器负责回收,因此大小和生命周期不需要确定,具有很大的灵活性。
对于字符串来说(String是类):其对象的引用都是存储在栈中的,如果是编译期已经创建好(用双引号定义的)就存储在常量池中,如果是运行期(new出来的)才能确定的就存储在堆中。对于equals相等的字符串,在常量池中只有一份,而在堆中有多份。Equals方法看的两个对象在常量池里面的值是否相等,“=
=”方法看的是对象的引用是否相等,比如s1,s2,s3都指向常量池的“china”,那么“=
=”方法返回true,ss1,ss2,ss3指向堆中不同的new对象,所以==方法返回false。对于equals相等的字符串,在常量池中永远只有常量池中永远只有一份,在堆中有多份。
java中特殊的String类型
Java中String是一个特殊的包装类数据有两种创建形式:
String s = "abc";
String s = new String("abc");
1.第一种先在栈中创建一个对String类的对象引用变量s,然后去查找"abc"是否被保存在字符串常量池中,如果没有则在栈中创建三个char型的值'a'、'b'、'c',然后在堆中创建一个String对象object,它的值是刚才在栈中创建的三个char型值组成的数组{'a'、'b'、'c'},接着这个String对象object被存放进字符串常量池,最后将s指向这个对象的地址,如果"abc"已经被保存在字符串常量池中,则在字符串常量池中找到值为"abc"的对象object,然后将s指向这个对象的地址。
第一种特点:JVM会自动根据栈中数据的实际情况来决定是否有必要创建新对象。
2.第二种可以分解成两步1、String object = "abc";2、String s = new
String(object);第一步参考第一种创建方式,而第二步由于"abc"已经被创建并保存到字符串常量池中,因此jvm只会在堆中新创建一个String对象,它的值共享栈中已有的三个char型值。
第二种特点:一概在堆中创建新对象,而不管其字符串值是否相等,是否有必要创建新对象。
举个例子:
String s1 = "china";
String s2 = "china";
String s3 = "china";
String ss1 = new String("china");
String ss2 = new String("china");
String ss3 = new String("china");
解释一下堆指向常量池这3个箭头,对于通过new产生一个字符串(假设为”china”)时,先去常量池中查找是否已经有了”china”对象,如果没有则在常量池中创建一个此字符串对象,然后堆中再创建一个常量池中此“china”对象的拷贝对象。这也就是有道面试题:String
s = new
String(“xyz”);产生几个对象?一个或两个,如果常量池中原来没有”xyz”,就是两个。指针是ss1先指向堆里面new的引用变量,堆里面new的引用变量再指向常量池里面的“china”
1)对于基本数据类型的变量和常量:变量和引用存储在栈中,常量存储在常量池中。
int
i1 = 9;
int
i2 = 9;
int
i3 = 9;
public static final int INT1 = 9;
public static final int INT2 = 9;
public static final int INT3 = 9;
栈里只有一个9 ,i1,i2,i3 都指向9 。
如果i2=7会在栈里生成7 ,再令i2指向7。
另外,局部变量(形式参数)的数据存储在栈中,并且它随方法的消失而消失
2)对于成员变量和局部变量:局部变量必须初始化。形式参数是局部变量,局部变量的数据存在于栈内存中。栈内存中的局部变量随着方法的消失而消失。成员变量存储在堆中的对象里面,由垃圾回收器负责回收。
==,equals和hashCode()区别
=
=: 比较的是内存中的地址。对于基本类型:相当于比较的就是值是否相同;对于引用类型:比较的就是地址值是否相同
Equals:用来判断两个对象的值是否相等。如果一个类没有定义自己的equals()方法,那么它默认的equals()方法就是从Object类继承的相当于==运算符,即比较两个变量指向的对象内存是否相等。如果一个类希望能比较两个实例对象的值是否相等,那么就可以覆盖Object类的equals()方法。例如String类的equals()方法就是用于比较两个独立对象的内容是否相等(即堆中的内容是否相等)。
hashCode():Obejct类的 hashCode()
的作用是获取哈希码,也称为散列码;它实际上是返回一个int整数,其实就是对象的内存地址值十进制表示。这个哈希码的作用是确定该对象在哈希表中的索引位置。在Java中任何一个对象都具备equals(Object
obj)和hashCode()这两个方法,因为他们是在Object类中定义的。如果重写了一个对象的equals方法,那么它的hashcode方法也重写。
equal和==的代码应用
例1.字符串常量池的使用
String s0 = "abc";
String s1 = "abc";
System.out.println(s0==s1); //true 可以看出s0和s1是指向同一个对象的。
例2.String中= =和equals的区别
String s0 =new String ("abc");
String s1 =new String ("abc");
System.out.println(s0==s1); //false 可以看出用new的方式是生成不同的对象
System.out.println(s0.equals(s1)); //true
可以看出equals比较的是两个String对象的内容(值)
例3.编译期确定
String s0="helloworld";
String s1="helloworld";
String s2="hello" + "word";
System.out.println( s0= =s1 ); //true 可以看出s0跟s1是同一个对象
System.out.println( s0= =s2 ); //true 可以看出s0跟s2是同一个对象
分析:因为例子中的 s0和s1中的"helloworld”都是字符串常量,它们在编译期就被确定了,所以s0=
=s1为true;而"hello”和"world”也都是字符串常量,当一个字符串由多个字符串常量连接而成时,它自己肯定也是字符串常量,所以s2也同样在编译期就被解析为一个字符串常量,所以s2也是常量池中"helloworld”的一个引用。所以我们得出s0=
=s1==s2;
例4.编译期无法确定
String s0="helloworld";
String s1=new String("helloworld");
String s2="hello" + new String("world");
System.out.println( s0==s1 ); //false
System.out.println( s0==s2 ); //false
System.out.println( s1==s2 ); //false
分析:用new String() 创建的字符串不是常量,不能在编译期就确定,所以new String()
创建的字符串不放入常量池中,它们有自己的地址空间。
s0还是常量池中"helloworld”的引用,s1因为无法在编译期确定,所以是运行时创建的新对象"helloworld”的引用,s2因为有后半部分new
String(”world”)所以也无法在编译期确定,所以也是一个新创建对象"helloworld”的引用;
例5.编译期优化
String s0 = "a1";
String s1 = "a" + 1;
System.out.println((s0 == s1)); //result = true
String s2 = "atrue";
String s3= "a" + "true";
System.out.println((s2 == s3)); //result = true
String s4 = "a3.4";
String s5 = "a" + 3.4;
System.out.println((a == b)); //result = true
分析:在程序编译期,JVM就将常量字符串的"+“连接优化为连接后的值,拿"a” +
1来说,经编译器优化后在class中就已经是a1。在编译期其字符串常量的值就确定下来,故上面程序最终的结果都为true。
例6.编译期无法确定
String s0 = "ab";
String s1 = "b";
String s2 = "a" + s1;
System.out.println((s0 == s2)); //result = false
分析:JVM对于字符串引用,由于在字符串的"+“连接中,有字符串引用存在,而引用的值在程序编译期是无法确定的,即"a” +
s1无法被编译器优化,只有在程序运行期来动态分配并将连接后的新地址赋给s2。所以上面程序的结果也就为false。
例7.编译期确定
String s0 = "ab";
final String s1 = "b";
String s2 = "a" + s1;
System.out.println((s0 == s2)); //result = true
分析:和[6]中唯一不同的是s1字符串加了final修饰,对于final修饰的变量,它在编译时被解析为常量值的一个本地拷贝存储到自己的常量
池中或嵌入到它的字节码流中。所以此时的"a" + s1和"a" + "b"效果是一样的。故上面程序的结果为true。
例8.编译期无法确定
String s0 = "ab";
final String s1 = getS1();
String s2 = "a" + s1;
System.out.println((s0 == s2)); //result = false
private static String getS1() { return "b"; }
分析:JVM对于字符串引用s1,它的值在编译期无法确定,只有在程序运行期调用方法后,将方法的返回值和"a"来动态连接并分配地址为s2,故上面
程序的结果为false。
关于String的不可变设计
String是不可改变类(记:基本类型的包装类都是不可改变的)的典型代表,也是Immutable设计模式的典型应用,String变量一旦初始化后就不能更改,禁止改变对象的状态,从而增加共享对象的坚固性、减少对象访问的错误,同时还避免了在多线程共享时进行同步的需要。
Immutable模式的实现主要有以下两个要点:
1.除了构造函数之外,不应该有其它任何函数(至少是任何public函数)修改任何成员变量。
2.任何使成员变量获得新值的函数都应该将新的值保存在新的对象中,而保持原来的对象不被修改。
String的不可变性导致字符串变量使用+号的代价:
例9:
String s = "a" + "b" + "c";
String s1 = "a";
String s2 = "b";
String s3 = "c";
String s4 = s1 + s2 + s3;
分析:变量s的创建等价于 String s = “abc”;
由上面例子可知编译器进行了优化,这里只创建了一个对象。由上面的例子也可以知道s4不能在编译期进行优化,其对象创建相当于:
StringBuffer temp = new StringBuffer();
temp.append(s1).append(s2).append(s3);
String s = temp.toString();
由上面的分析结果,可就不难推断出String 采用连接运算符(+)效率低下原因分析,形如这样的代码:
每做一次 +
就产生个StringBuffer对象,然后append后就扔掉。下次循环再到达时重新产生个StringBuffer对象,然后append
字符串,如此循环直至结束。如果我们直接采用StringBuffer对象进行append的话,我们可以节省N -
1次创建和销毁对象的时间。所以对于在循环中要进行字符串连接的应用,一般都是用StringBuffer或StringBulider对象来进行append操作。