String的常见面试题
1. String的基本特性
String:字符串,使用一对""引起来进行表示
两种实例化的方式:
String str1 = "abc";//字面量的方式
String str2 = new String("ABC");//new对象的方式
String声明为final的,不可以被继承
Spring实现了Serializable接口:表示字符串是支持序列化的,
Spring实现了Comparable接口:表示String是可以进行比较的
String在jdk8即以前内部定义了final char[] value用来存储字符串数据;在jdk9时改成了byte[]
String代表不可变的字符序列.简称不可变性
(1)当对字符串重新赋值时,需要重写指定内存区域赋值,不能使用原有的value进行赋值
@Test
public void test01(){
String s1 = "abc"; //字面量的形式创建的String放在字符串常量池中
String s2 = "abc"; //字符窗常量池中不会存储相同的字符串
System.out.println(s1 == s2);//此时两个相同字符串的地址是一样的:true
s1 = "ABC"; //当对字符串重新赋值时,需要重写指定内存区域赋值,不能使用原有的value进行赋值
System.out.println(s1 == s2); //判断两个字符串的地址,此时输出:false
}
(2)当对现有的字符串进行连接操作时,也需要重新指定内存区域赋值,不能使用原有的value进行赋值
@Test
public void test01(){
String s1 = "abc"; //字面量的形式创建的String放在字符串常量池中
String s2 = "abc"; //字符串常量池中不会存储相同的字符串
s2 = s2 + "def";
System.out.println(s1);
System.out.println(s2);
}
(3)当调用String的replace()方法修改指定字符或者字符串时,也需要重新指定内存区域赋值
@Test
public void test02(){
String s1 = "abc";
String s2 = s1.replace("a","m");
System.out.println(s1);
System.out.println(s2);
}
2.通过字面量的方式(String str = “sss”😉,区别于new的方式(String str2 = new String(“sss”)😉,此时的字符串声明在字符串常量池中.
字符串常量池:jdk7及以后版本在堆空间中,同时注意:字符串常量池是不会存储相同内容的字符串的.
StringPool(字符串常量池):是一个固定大小的HashTable,jdk6默认大小长度为1009,jdk7以后为60013,jdk8以后1009是设置的最小值;如果放进StringPool的String非常多,就会造成Hash冲突严重,从而导致链表会很长,而链表长了以后会造成的影响就是调用String.intern()时性能会大幅度下降.
使用**-XX:StringTableSize**可以设置StringTable的长度
2. String的内存分配
- 在Java语言中有8中基本数据类型和一种比较特殊的类型String。这些类型为了使它们在运行过程中能够做到速度更快,更加地节省空间,都提供了常量池的概念
- 常量池就是类似一个Java系统级别提供的缓存。8中基本数据类型的常量池都是系统协调的,String类型的常量池就比较的特殊,它的主要方式有两种:
- 直接使用双引号声明出来的String对象就会直接存储在常量池中。例如:String info = “abc”;
- 如果不是双引号声明的String对象,可以使用String提供的intern()方法
String内存分配演进过程:
1.在jdk6以及以前的版本,字符串常量池存放在永久代中;
2.jdk7中,将字符串常量池进行整改:将字符串常量池的位置放到了Java堆中
所有的字符串都保存在堆中,和其他的普通对象一样,这样你可以在进行调优应用时仅仅需要调整堆的大小了;
字符串常量池概念原本使用得比较多,可以使用String.intern();
3.jdk8中剔除了永久代,引进了元空间,字符串常量池仍然保存在Java堆中
3. String的基本操作
基本操作代码1:
public class StringTest {
public static void main(String[] args) {
System.out.println();//2293
System.out.println("1");//2294
System.out.println("2");
System.out.println("3");
System.out.println("4");
System.out.println("5");
System.out.println("6");
System.out.println("7");
System.out.println("8");
System.out.println("9");
System.out.println("10");//2303
//如下的字符串"1" 到 "10"不会再次加载
System.out.println("1");//2304
System.out.println("2");//2304
System.out.println("3");
System.out.println("4");
System.out.println("5");
System.out.println("6");
System.out.println("7");
System.out.println("8");
System.out.println("9");
System.out.println("10");//2304
}
}
基本操作代码2:
class Memory {
public static void main(String[] args) {//line 1
int i = 1;//line 2
Object obj = new Object();//line 3
Memory mem = new Memory();//line 4
mem.foo(obj);//line 5
}//line 9
private void foo(Object param) {//line 6
String str = param.toString();//line 7
System.out.println(str);
}//line 8
}
对应的内存结构图如下:
4. 字符串的拼接操作
注意以下要点:
1.字符串常量和字符串常量的拼接的结果在字符串常量池中,原理是编译器优化;
2.常量池中不会存放相同内容的常量
3.只要有一个是变量,结果就会在保存在堆中.变量拼接的原理是StringBuilder;
4.如果拼接的结果调用了intern()方法,则会主动将常量池中还没有的字符串对象放到字符串常量池中,并且返回次对象的地址;
代码1—垃圾斗师:
@Test
public void test1(){
String s1 = "a" + "b" + "c";//编译期优化:等同于"abc"
String s2 = "abc"; //"abc"一定是放在字符串常量池中,将此地址赋给s2
/*
* 最终.java编译成.class,再执行.class
* String s1 = "abc";
* String s2 = "abc"
*/
System.out.println(s1 == s2); //true(既比较值,还比较地址值)
System.out.println(s1.equals(s2)); //true(只比较值)
}
代码2—斗王强者
@Test
public void test2(){
String s1 = "javaEE";
String s2 = "hadoop";
String s3 = "javaEEhadoop";
String s4 = "javaEE" + "hadoop";//编译期优化
//如果拼接符号的前后出现了变量,则相当于在堆空间中new String(),具体的内容为拼接的结果:javaEEhadoop
String s5 = s1 + "hadoop";
String s6 = "javaEE" + s2;
String s7 = s1 + s2;
System.out.println(s3 == s4);//true
System.out.println(s3 == s5);//false
System.out.println(s3 == s6);//false
System.out.println(s3 == s7);//false
System.out.println(s5 == s6);//false
System.out.println(s5 == s7);//false
System.out.println(s6 == s7);//false
//intern():判断字符串常量池中是否存在javaEEhadoop值,如果存在,则返回常量池中javaEEhadoop的地址;
//如果字符串常量池中不存在javaEEhadoop,则在常量池中加载一份javaEEhadoop,并返回次对象的地址。
String s8 = s6.intern();
System.out.println(s3 == s8);//true
}
内存结构图如下所示:
字符串拼接的底层原理剖析:斗皇巅峰
@Test
public void test3(){
String s1 = "a";
String s2 = "b";
String s3 = "ab";//字符串常量池
/*
如下的s4 = s1 + s2 的执行细节:(变量s是我基于底层临时定义的)
① StringBuilder s = new StringBuilder();
② s.append("a");
③ s.append("b");
④ s.toString(); --> 约等于 new String("ab"):底层调用了new String("ab"),但是没有往字符串里去存放new的String字符串对象(后面详细讲述)
补充:在jdk5.0之后使用的是StringBuilder,在jdk5.0之前使用的是StringBuffer
*/
String s4 = s1 + s2;//
System.out.println(s3 == s4);//false
}
用final修饰字符串—则为常量形式!!(斗皇巅峰)
/*
1. 字符串拼接操作不一定使用的是StringBuilder!!!
如果拼接符号左右两边都是字符串常量或常量引用,则仍然使用编译期优化,即非StringBuilder的方式。
2. 针对于final修饰类、方法、基本数据类型、引用数据类型的量的结构时,能使用上final的时候建议使用上。
*/
@Test
public void test4(){
//此时用final修饰s1和s2,则s1,s2为常量形式
final String s1 = "a";
final String s2 = "b";
String s3 = "ab";
String s4 = s1 + s2;//此时没有上面利用StringBuilder去创建对象,而是从常量池中拿到s1和s2拼接的结果"ab"
System.out.println(s3 == s4);//true
}
注意:通过StringBuilder的append()的api方式去添加字符串的效率远高于使用String字符串拼接方式
因为String字符串拼接方式每次 都会创建StringBuilder,String对象,这样既会浪费时间,还使得内存占用过大,可能导致GC的频繁触发.
5. intern()方法------斗宗级别方可入此门
intern()方式的使用------斗宗一星
如果不是用双引号声明的String对象,可以使用String提供的intern()方法:
intern()方法会从字符串常量池中查询当前字符串是否存在?
(1)如果不存在,就会将当前字符串放到字符串常量池中,返回结果是对应字符串常量池该字符串的地址
比如:String myInfo = new String(“abc”).intern();
(2)如果存在,则直接返回对应字符串常量池该字符串的地址
也就是说,如果任意字符串上调用String.intern()方法,那么返回结果所指向的那个类实例,必须和直接以常量形式出现的字符串实例完全相同才行,即如下代码所示:
("a" + "b" + "c").intern() = = "abc";//返回结果true
通俗来讲:intern()方法就是确保字符窗在内存(字符串常量池)中只有一份拷贝!这样可以节约内存空间,加快字符串操作任务的执行速度.
* 如何保证变量s指向的是字符串常量池中的数据呢?
* 有两种方式:
* 方式一: String s = "shkstart";//字面量定义的方式
* 方式二: 调用intern()
* String s = new String("shkstart").intern();
* String s = new StringBuilder("shkstart").toString().intern();
new String(“xxx”)到底创建了几个对象?------斗宗五星巅峰
答:两个对象
String s = new String("ab");
会在堆空间中创建两个对象:
一个对象是:new关键字在堆空间创建的
另一个对象是:字符串常量池中的对象"ab"
new String(“xxx”) + new String(“yyy”)又会创建几个对象呢?------斗宗九星巅峰
答:5个对象,若深入底层则为6个对象
new String("a") + new String("b")呢?----5个对象
对象1:new StringBuilder()
对象2: new String("a")----append添加到StringBuilder
对象3: 常量池中的"a"
对象4: new String("b")----append添加到StringBuilder
对象5: 常量池中的"b"
深入剖析: StringBuilder的toString():
对象6 :new String("ab")
强调一下,toString()的调用,在字符串常量池中,没有生成"ab"
public class StringNewTest {
public static void main(String[] args) {
String str = new String("a") + new String("b");
}
}
你是否已经准备好了呢?斗尊强者
终结面试题1------斗尊强者
public class StringIntern {
public static void main(String[] args) {
String s = new String("1");//创建两个对象:字符串常量池里存放"1"
s.intern();//调用此方法之前,字符串常量池中已经存在了"1"
String s2 = "1";
System.out.println(s == s2);//jdk6:false jdk7/8:false
--------------------------------------------------------------------------------------------------------------------------------------------------
String s3 = new String("1") + new String("1");//s3变量记录的地址为:new String("11")
//执行完上一行代码以后,字符串常量池中,是否存在"11"呢?答案:不存在!!
s3.intern();//在字符串常量池中生成"11"。
//jdk6:创建了一个新的对象"11",也就有新的地址。
//(重点)jdk7/8:此时常量中并没有创建"11",而是创建一个指向堆空间中new String("11")的地址
String s4 = "11";//s4变量记录的地址:使用的是上一行代码代码执行时,在常量池中生成的"11"的地址
System.out.println(s3 == s4);//jdk6:false jdk7/8:true
}
}
注意:以下的面试题版本皆为JDK8(因为上面的JDK太古老了)
终结面试题2------斗尊巅峰
public class StringIntern1 {
public static void main(String[] args) {
//StringIntern.java中练习的拓展:
String s3 = new String("1") + new String("1");//new String("11")
//执行完上一行代码以后,字符串常量池中,是否存在"11"呢?答案:不存在!!
String s4 = "11";//在字符串常量池中生成对象"11"
String s5 = s3.intern();
System.out.println(s3 == s4);//false
System.out.println(s5 == s4);//true
}
}
总结:intern()
1.jdk1.6中,将这个字符串对象尝试放入字符串常量池中
如果字符串常量池中有,则不会放入.返回已有的串池中的对象的地址;
如果没有,会把此对象复制一份,放到字符串常量池中,并返回字符串常量池中的对象地址;
2.jdk1.7开始,将这个字符串对象尝试放入字符串常量池中
如果串池中有,则并不会放入,而是返回已有串池的对象的地址
如果没有,则会将对象的引用地址复制一份,放入串池中,并返回串池中的引用地址;
intern()练习------斗圣强者
练习代码1:
public class StringExer1 {
public static void main(String[] args) {
String s = new String("a") + new String("b");//new String("ab")
//在上一行代码执行完以后,字符串常量池中并没有"ab"
String s2 = s.intern();//jdk6中:在串池中创建一个字符串"ab"
//jdk8中:串池中没有创建字符串"ab",而是创建一个引用,指向new String("ab"),将此引用返回
System.out.println(s2 == "ab");//jdk6:true jdk8:true
System.out.println(s == "ab");//jdk6:false jdk8:true
}
}
jdk8版本内存结构图:
练习代码2:
public class StringExer1 {
public static void main(String[] args) {
String x = "ab";//存放在常量池中
String s = new String("a") + new String("b");//new String("ab")
String s2 = s.intern();//此时常量池中已经存在"ab",直接返回其对象地址给s2
System.out.println(s2 == x);//true
System.out.println(s == x);//false
}
}
内存结构图:
练习代码3:
public class StringExer2 {
public static void main(String[] args) {
String s1 = new String("a") + new String("b");执行完以后,不会在字符串常量池中会生成"ab"
s1.intern();
String s2 = "ab";
System.out.println(s1 == s2);//true
}
}
练习代码4:
public class StringExer2 {
public static void main(String[] args) {
String s1 = new String("ab");//执行完以后,会在字符串常量池中会生成"ab"
s1.intern();
String s2 = "ab";
System.out.println(s1 == s2);//false
}
}
总结:
此时此刻,你已经成为斗圣巅峰强者,面试定能反问倒面试官!,再加以修炼,定能冲击斗帝
6. intern其他知识点
intern()的应用场景
使用intern()测试执行效率:空间使用上:对于程序中大量存在存在的字符串,尤其其中存在很多重复字符串时,使用intern()可以节省内存空间
应用场景:大的网站平台.需要内存中存储大量的字符串,比如社交网站,很多人都需要存储类似地址信息,但经常性的这些地址存在很多的相同相似性,这时候如果字符串都调用intern()方法,将会明显地降低内存的大小
public class StringIntern2 {
static final int MAX_COUNT = 1000 * 10000;
static final String[] arr = new String[MAX_COUNT];
public static void main(String[] args) {
Integer[] data = new Integer[]{1,2,3,4,5,6,7,8,9,10};
long start = System.currentTimeMillis();
for (int i = 0; i < MAX_COUNT; i++) {
//通过两种方式比较可以得出intern()方法对内存的消耗十分地小,节省了大量的内存空间
//arr[i] = new String(String.valueOf(data[i % data.length]));
arr[i] = new String(String.valueOf(data[i % data.length])).intern();
}
long end = System.currentTimeMillis();
System.out.println("花费的时间为:" + (end - start));
try {
Thread.sleep(1000000);
} catch (InterruptedException e) {
e.printStackTrace();
}
System.gc();
}
}
G1 GC 的String去重操作
Java堆中存活的数据集合差不多25%是String对象,其中,里面的差不多一半的String对象都是重复的(即string1.equals(string2) = true);则堆上重复的String对象必然是一种内存的浪费.故在G1垃圾收集器中实现了自动持续对重复的String对象进行去重,这样就能避免浪费内存.
那么是如何实现的呢?
1.当垃圾收集器工作时,会访问堆上存活的对象.对于每一个访问的对象都会检查是否是候选的要去重的String对象
2.如果是,把这个对象的一个引用插入到队列中等待后续的处理.一个去重的线程在后台运行,处理这个队列,处理队列的一个元素意味着从队列中删除这个元素,然后尝试去重它引用的String对象.
3.使用一个hashtable来记录所有的被String对象使用的不重复的char数组.当要去重的时候,会查这个hashtable,来看堆中是否已经存在一个一模一样的char数组;
4.如果存在,String对象会被调整引用那个数组,释放对原来的数组的引用,最终会被垃圾收集器回收掉;
5.如果查找失败,char数组会被插入到hashtable,这样以后就可以共享这个数组了;
可以使用命令行进行String去重的开启:
对象都是重复的(即string1.equals(string2) = true);则堆上重复的String对象必然是一种内存的浪费.故在G1垃圾收集器中实现了自动持续对重复的String对象进行去重,这样就能避免浪费内存.
那么是如何实现的呢?
1.当垃圾收集器工作时,会访问堆上存活的对象.对于每一个访问的对象都会检查是否是候选的要去重的String对象
2.如果是,把这个对象的一个引用插入到队列中等待后续的处理.一个去重的线程在后台运行,处理这个队列,处理队列的一个元素意味着从队列中删除这个元素,然后尝试去重它引用的String对象.
3.使用一个hashtable来记录所有的被String对象使用的不重复的char数组.当要去重的时候,会查这个hashtable,来看堆中是否已经存在一个一模一样的char数组;
4.如果存在,String对象会被调整引用那个数组,释放对原来的数组的引用,最终会被垃圾收集器回收掉;
5.如果查找失败,char数组会被插入到hashtable,这样以后就可以共享这个数组了;
可以使用命令行进行String去重的开启:
UseStringDeduplication(bool)