堆是gc的主要工作区域,为了高效的gc,会把堆细分更多的子区域
public void method1(){
Object obj=new Object();
}
1,生成了2部分的内存区域,1)obj这个引用变量,因为是方法内的变量,放到jvm stack里面(栈帧的局部变量表),2)真正object class的实例对象,放到heap里面
2,上述的new语句一共消耗12个bytes,JVM规定引用占4个bytes(在jvm stack)而空对象是8个bytes(在heap)
方法结束后,对应stack中的变量马上回收,但是heap中的对象要等到GC来回收
垃圾判断的算法
(1)引用计数算法
1,给对象添加一个引用计数器,当有一个地方引用它,计数器加1,当引用失效,计数器减1,任何时刻计数器为0的对象就是不可能再被使用的
2,引用计数算法无法解决对象循环引用的问题,比如堆中对象a和对象b,没人引用再引用他们,但是他们互相引用
(2)根搜索算法:
1,在实际的生产语言中(java,c#),都是使用根搜索算法判断对象是否存活
2,算法基本思路就是通过一系列的成为GC ROOTS的点作为起始进行向下搜索,当一个对象到GC ROOTS没有任何引用链相连,则证明此对象是不可用的
3,在java语言中,GC Roots包括:
1)在vm栈(栈帧中的本地变量)中的引用
2)方法区中的静态变量
3)JNI(一般说的native方法)中的引用
方法区:
1,java虚拟机规范表示可以不要求虚拟机在这区实现GC,这区GC的性价比一般比较低
2,在堆中,尤其在新生代,常规应用进行一次GC一般可以回收70%-95%的空间,而方法区的GC效率远小于此
3,当前的商业jvm都有实现方法区的GC,主要回收两部分内容:废弃常量和无用类,类回收需要满足以下3个条件:
1)该类所有的实例都已经被GC,也就是jVM中不存在该Class的任何实例,
2)加载该类的ClassLoader已经被GC
3)该类对应的java.lang.class对象没有在任何地方被引用,如不能再任何地方通过反射该问该类的方法
4,在大量使用反射,动态代理,CGlib等字节码框架,动态生成jsp以及osgi这类频繁自定义classloader的场景都需要jvm具备类卸载的支持,以保证方法区不会溢出
JVM常见GC算法:
1,标记-清除算法
算法分为 标记 和 清除两个阶段,首先标记处所有需要回收的对象,然后回收所有需要回收的对象
缺点:1)效率问题,标记和清理两个过程效率都不高
2)空间问题,标记清除之后会产生大量不连续的内存碎片,空间碎片太多可能会导致后续使用中无法找到足够的连续内 存而提前触发另一次垃圾搜索动作
2,标记-整理算法
标记过程仍然一样,但后续步骤不是进行直接清理,而是令所有存活的对象一端移动,然后然后直接清理掉这端边界以外的内存
没有内存碎片,比标记清除耗费更多的时间进行整理
3,复制,搜集算法
将可用的内存划分为两块,每次只使用其中的一块,当半区内存用完了,仅将还存活的对象复制到另外一块上面,然后就把原来整块内存空间一次性清理掉,这样使得每次内存回收都是对整个半区的回收,内存分配就不用考虑内存碎片的问题,只要移动堆顶指针,按顺序分配内存就可以了,只是这种算法的代价是将内存缩小为原来的一半,代价高
现在的商业虚拟机都是用了这一种收集算法来回收新生代
将内存分为一块较大的eden空间和2块较少的survivor空间,每次使用eden和其中一块survivor,当回收时将eden和survivor还存活的对象一次性拷贝到另外一块survivor空间上,然后清理掉eden的用过的survivor
oracle Hotspot虚拟机默认的eden和survivor的大小比例是8:1,也就是每次只有10%的内存是浪费的
这种收集算法在对象存活率高的时候,效率不高,因为会大量的复制,所以在老年代是不能直接使用这种方式的
只需要扫描存活的对象,效率更高
不会产生碎片
需要浪费额外的内存作为复制区
复制算法非常适合生命周期比较短的对象,因为每次GC能回收大部分对象,复制的开销比较低
根据IBM的专门研究,98%的java对象只会存活1个GC周期,对这些对象很适合用,而且不用1:1的划分工作区和复制区的空间
4,分代算法
当前商业虚拟机的垃圾收集都是采用 分代收集,算法,根据对象不同的存活周期将内存划分为几块
一般是把java堆分作新生代和老年代,这样就可以根据各个年代的特点采取最适当的收集算法,譬如新生代每次GC都有大批对象死去,那就选用复制,
年轻代:新生成的兑现都放在新生代,年轻代用复制算法进行GC,年轻代分为三个去,一个eden区,两个survivor(可以通过参数设置survivor个数),对象在eden中生成,当eden区满了,此区的存活对象将被复制到另外一个survivor区,当第二个survivor区也满了的时候,从第一个survivor复制过来的并且此时还存活的对象,将被复制到老年代
老年代:存放了经过一次或多次GC还存活的对象,一般采用标记清除或者标记整理算法进行GC,
内存回收:
GC要做的是将那些dead的对象所占用的内存回收掉,Hotspot认为没有引用的对象是dead的
hotspot将引用分为四种:强引用,软引用,弱引用,虚引用
在Full GC时会对引用的引用类型进行特殊处理:
软引用:内存不够时一定会被GC,长期不用也被GC,
弱引用:一定会被GC,当被mark为dead,会在referenceQuene中通知
虚引用:本来就没引用,当从jvmheap中释放时会通知
GC的时机:
在分代模型的基础上,GC从时机上分为两种:scavenge GC和Full GC,
Scavenge GC 触发时机:新对象生成时,eden空间满了,理论上eden区大多数对象会在scavenge GC回收,复制算法的执行效率会很高,时间比较短
Full GC 对整个JVM进行整理,主要的触发时机:1)old满了,2)perm满了,3)执行了system.gc(),效率很低,
垃圾收集器的 并行和并发
并行(parallel):指多个收集器的线程同时工作,但是用户线程处于等待状态
并发(concurrent):指收集器在工作的同时,可以允许用户线程工作,并发并不代表解决了GC停顿的问题,在关键的步骤,还是要停顿,比如收集器在标记垃圾的时候,但在清除垃圾的时候,用户线程可以和GC线程并发执行