一、JVM运行时内存布局
按java 8虚拟机规范的原始表达:(jvm)Run-Time Data Areas, 暂时翻译为“jvm运行时内存布局”。
- 从概念上大致分为6个(逻辑)区域。注:Method Area中还有一个常量池区,图中未明确标出。
- 方法区:
- 堆:
- 虚拟机栈:
- 本地方法栈:
- 程序计数器:
- 运行时数据区:
-
按线程是否共享
- 每个线程独享:生命周期与Thread相同,即:线程创建时,相应的区域分配内存,线程销毁时,释放相应内存。
- 虚拟机栈:记录每个栈帧(Frame)中的局部变量、方法返回地址等。注:这里出现了一个新名词“栈帧”。线程中每次有方法调用时,会创建Frame,方法调用结束时Frame销毁。
- 程序计数器:记录每个线程当前执行的指令信。eg:当前执行到哪一条指令,下一条该取哪条指令。
- 本地方法栈:调用操作系统原生本地方法时,所需要的内存区域。
- 线程共享:Heap、Method Area 都是在虚拟机启动时创建,虚拟机退出时释放。
- 方法区:方法区,主要存放类结构、类成员定义,static静态成员等。
- 堆:堆内存区,也是GC垃圾回收的主站场,用于存放类的实例对象及Arrays实例等。
- 运行时常量池:运行时常量池,比如:字符串,int -128~127范围的值等,它是Method Area中的一部分。
- 每个线程独享:生命周期与Thread相同,即:线程创建时,相应的区域分配内存,线程销毁时,释放相应内存。
-
提一个问题:总体来看,JVM把内存划分为“栈(stack)”与“堆(heap)”两大类,为何要这样设计?
- 个人理解,程序运行时,内存中的信息大致分为两类,一是跟程序执行逻辑相关的指令数据,这类数据通常不大,而且生命周期短;一是跟对象实例相关的数据,这类数据可能会很大,而且可以被多个线程长时间内反复共用,比如字符串常量、缓存对象这类。
二、GC垃圾回收原理
-
2.1 如何判断对象是垃圾 ?
- 引用计数法,思路很简单,但是如果出现循环引用,即:A引用B,B又引用A,这种情况下就不好办了,所以JVM中使用了另一种称为“可达性分析”的判断方法:
- 还是刚才的循环引用问题(也是某些公司面试官可能会问到的问题),如果A引用B,B又引用A,这2个对象是否能被GC回收?答案:关键不是在于A、B之间是否有引用,而是A、B是否可以一直向上追溯到GC Roots。如果与GC Roots没有关联,则会被回收,否则将继续存活。
-
2.2 哪些内存区域需要GC ?
- 在第一部分JVM内存布局中,我们知道了thread独享的区域:PC Regiester、JVM Stack、Native Method Stack,其生命周期都与线程相同(即:与线程共生死),所以无需GC。线程共享的Heap区、Method Area则是GC关注的重点对象。
-
2.3 常用的GC算法
- mark-sweep 标记清除法:标记出来后直接清空。该方法简单快速,但是缺点也很明显,会产生很多内存碎片。
- mark-copy 标记复制法:思路也很简单,将内存对半分,总是保留一块空着,将左侧存活的对象复制到右侧,然后左侧全部清空。避免了内存碎片问题,但是内存浪费很严重,相当于只能使用50%的内存。
- mark-compact 标记-整理(也称标记-压缩)法:避免了上述两种算法的缺点,将垃圾对象清理掉后,同时将剩下的存活对象进行整理挪动(类似于windows的磁盘碎片整理),保证它们占用的空间连续,这样就避免了内存碎片问题,但是整理过程也会降低GC的效率。
-
generation-collect 分代收集算法
- 年青代(Young Genaration)Young Genaration更是又细为分eden,S0,S1三个区:
- 老年代(Old Generation)
- 永久代(Permanent Generation)