最近做到一個題目:
問題:String str = new String(“abc”),“abc”在內存中是怎么分配的? 答案是:堆,字符串常量區。
題目考查的為Java中的字符串常量池和JVM運行時數據區的相關概念。"abc"為字面量對象,其存儲在堆內存中。而字符串常量池則存儲的是字符串對象的一個引用。
Java中的字符串常量池
Java中字符串對象創建有兩種形式,一種為字面量形式,如String str = "droid";,另一種就是使用new這種標准的構造對象的方法,如String str = new String("droid");,這兩種方式我們在代碼編寫時都經常使用,尤其是字面量的方式。然而這兩種實現其實存在着一些性能和內存占用的差別。這一切都是源於JVM為了減少字符串對象的重復創建,其維護了一個特殊的內存,這段內存被成為字符串常量池或者字符串字面量池。
工作原理
當代碼中出現字面量形式創建字符串對象時,JVM首先會對這個字面量進行檢查,如果字符串常量池中存在相同內容的字符串對象的引用,則將這個引用返回,否則新的字符串對象被創建,然后將這個引用放入字符串常量池,並返回該引用。
舉例說明
字面量創建形式
String str1="droid";
JVM檢測這個字面量,這里我們認為沒有內容為droid的對象存在。JVM通過字符串常量池查找不到內容為droid的字符串對象存在,那么會創建這個字符串對象,然后將剛創建的對象的引用放入到字符串常量池中,並且將引用返回給變量str1。
如果接下來有這樣一段代碼:
String str2="droid";
同樣JVM還是要檢測這個字面量,JVM通過查找字符串常量池,發現內容為”droid”字符串對象存在,於是將已經存在的字符串對象的引用返回給變量str2。注意這里不會重新創建新的字符串對象。
驗證是否為str1和str2是否指向同一對象,我們可以通過這段代碼
System.out.println(str1==str2);
輸出:True.
使用new創建
String str3=new String("droid");
當我們使用了new來構造字符串對象的時候,不管字符串常量池中有沒有相同內容的對象的引用,新的字符串對象都會創建。因此我們使用下面代碼測試一下,
System.out.println(str1==str3);
結果返回:False 表明這兩個變量指向的為不同的對象.
intern
對於上面使用new創建的字符串對象,如果想將這個對象的引用加入到字符串常量池,可以使用intern方法。
調用intern后,首先檢查字符串常量池中是否有該對象的引用,如果存在,則將這個引用返回給變量,否則將引用加入並返回給變量。
String str4=str3.intern();
System.out.println(str4==str1);
輸出結果為True。
疑難問題
前提條件?
字符串常量池實現的前提條件就是Java中String對象是不可變的,這樣可以安全保證多個變量共享同一個對象。如果Java中的String對象可變的話,一個引用操作改變了對象的值,那么其他的變量也會受到影響,顯然這樣是不合理的。
引用 or 對象
字符串常量池中存放的是引用還是對象,這個問題是最常見的。字符串常量池存放的是對象引用,不是對象。在Java中,對象都創建在堆內存中。
關於驗證請參考原文。
優缺點
字符串常量池的好處就是減少相同內容字符串的創建,節省內存空間。
如果硬要說弊端的話,就是犧牲了CPU計算時間來換空間。CPU計算時間主要用於在字符串常量池中查找是否有內容相同對象的引用。不過其內部實現為HashTable,所以計算成本較低。
GC回收?
因為字符串常量池中持有了共享的字符串對象的引用,這就是說是不是會導致這些對象無法回收?
首先問題中共享的對象一般情況下都比較小。據我查證了解,在早期的版本中確實存在這樣的問題,但是隨着弱引用的引入,目前這個問題應該沒有了。
intern使用?
關於使用intern的前提就是你清楚自己確實需要使用。比如,我們這里有一份上百萬的記錄,其中記錄的某個值多次為美國加利福尼亞州,我們不想創建上百萬條這樣的字符串對象,我們可以使用intern只在內存中保留一份即可。關於intern更深入的了解請參考深入解析String#intern。
總有例外?
你知道下面的代碼,會創建幾個字符串對象,在字符串常量池中保存幾個引用么?
String test = "a" + "b" + "c";
答案是只創建了一個對象,在常量池中也只保存一個引用。我們使用javap反編譯看一下即可得知。
17:02 $ javap -c TestInternedPoolGC
Compiled from "TestInternedPoolGC.java"
public class TestInternedPoolGC extends java.lang.Object{
public TestInternedPoolGC();
Code:
0: aload_0
1: invokespecial #1; //Method java/lang/Object."":()V
4: return
public static void main(java.lang.String[]) throws java.lang.Exception;
Code:
0: ldc #2; //String abc
2: astore_1
3: return
看到了么,實際上在編譯期間,已經將這三個字面量合成了一個。這樣做實際上是一種優化,避免了創建多余的字符串對象,也沒有發生字符串拼接問題。關於字符串拼接,可以查看Java細節:字符串的拼接。
Java中的堆和棧的區別
當一個人開始學習Java或者其他編程語言的時候,會接觸到堆和棧,由於一開始沒有明確清晰的說明解釋,很多人會產生很多疑問,什么是堆,什么是棧,堆和棧有什么區別?更糟糕的是,Java中存在棧這樣一個后進先出(Last In First Out)的順序的數據結構,這就是java.util.Stack。這種情況下,不免讓很多人更加費解前面的問題。事實上,堆和棧都是內存中的一部分,有着不同的作用,而且一個程序需要在這片區域上分配內存。眾所周知,所有的Java程序都運行在JVM虛擬機內部,我們這里介紹的自然是JVM(虛擬)內存中的堆和棧。
區別
java中堆和棧的區別自然是面試中的常見問題,下面幾點就是其具體的區別
各司其職
最主要的區別就是棧內存用來存儲局部變量和方法調用。
而堆內存用來存儲Java中的對象。無論是成員變量,局部變量,還是類變量,它們指向的對象都存儲在堆內存中。
獨有還是共享
棧內存歸屬於單個線程,每個線程都會有一個棧內存,其存儲的變量只能在其所屬線程中可見,即棧內存可以理解成線程的私有內存。
而堆內存中的對象對所有線程可見。堆內存中的對象可以被所有線程訪問。
異常錯誤
如果棧內存沒有可用的空間存儲方法調用和局部變量,JVM會拋出java.lang.StackOverFlowError。
而如果是堆內存沒有可用的空間存儲生成的對象,JVM會拋出java.lang.OutOfMemoryError。
空間大小
棧的內存要遠遠小於堆內存,如果你使用遞歸的話,那么你的棧很快就會充滿。如果遞歸沒有及時跳出,很可能發生StackOverFlowError問題。
你可以通過-Xss選項設置棧內存的大小。-Xms選項可以設置堆的開始時的大小,-Xmx選項可以設置堆的最大值。
這就是Java中堆和棧的區別。理解好這個問題的話,可以對你解決開發中的問題,分析堆內存和棧內存使用,甚至性能調優都有幫助。
譯文信息