一、前言
平时编程时,在 Java
中创建对象,实际上是在堆上划分了一块区域,这个区域叫堆内内存。
- 使用这
-Xms -Xmx
来指定新生代和老年代空间大小的初始值和最大值,这初始值和最大值也被称为Java
堆的大小,即 堆内内存大小。 - 这个堆内内存完全受
JVM
管理,JVM
有垃圾回收机制,所以我们一般不必关系对象的内存如何回收。
剖开 JVM
内存模型,来看下其堆划分:
由图可知 Java8
使用元空间替代永久代且元空间放在堆外内存上,这是为啥?
- 类的元数据信息常用到,在
GC
时回收效率偏低。 - 类的元数据信息比较难以确定其大小,指定太小容易出现永久代溢出、指定太大则容易造成老年代溢出。
那什么是堆外内存?
堆外内存与堆内内存相对应,对于整个机器内存而言,除堆内内存以外部分即为堆外内存。
Java
程序一般使用 -XX:MaxDirectMemorySize
来限制最大堆外内存。
还有个问题:堆外内存属于用户空间还是内核空间? 用户空间。
(1)为什么需要堆外内存?
使用堆外内存,有这些好处:
- 直接使用堆外内存可以减少一次内存拷贝: 当进行网络
I/O
操作、文件读写时,堆内内存都需要转换为堆外内存,然后再与底层设备进行交互。 - 降低
JVM GC
对应用程序影响:因为堆外内存不受JVM
管理。 - 堆外内存可以实现进程之间、
JVM
多实例之间的数据共享。
那我就有个问题:为什么使用堆外内存可以减少一次内存拷贝呢?
原因:当进行网络
I/O
操作或文件读写时,如果使用堆内内存(HeapByteBuffer
),JDK
会先创建一个堆外内存(DirectBuffer
),再去执行真正的读写操作。
具体原因是:调用底层系统函数(write
、read
等),必须要求使用是连续的地址空间。
- 操作系统并不感知
JVM
的堆内存,而且JVM
的内存布局与操作系统所分配的是不一样的,操作系统并不会按照JVM
的行为来读写数据。 - 同一个对象的内存地址随着
JVM GC
的执行可能会随时发生变化,例如JVM GC
的过程中会通过压缩来减少内存碎片,这就涉及对象移动的问题了。
当然使用堆外内存,有这些弊端:
- 排查内存泄漏问题相对困难: 因为堆外内存需要手动释放,不熟悉对应框架源码,可能稍有不慎就会造成应用程序内存泄漏。
- 对开发人员的基础技能要求高。
由此可以看出,如果想实现高效的 I/O
操作、缓存常用的对象、降低 JVM GC
压力,堆外内存是一个非常不错的选择。
(2)如何分配堆外内存?
Java
中堆外内存的分配方式有两种:
-
NIO
类中的ByteBuffer#allocateDirect
-
Unsafe#allocateMemory
首先来看下 Java NIO
包中的 ByteBuffer
类的分配方式,使用方式如下:
// 分配 10M 堆外内存
ByteBuffer byteBuffer = ByteBuffer.allocateDirect(10 * 1024 * 1024);
// 释放堆外内存
((DirectBuffer) byteBuffer).cleaner().clean();