一、分类
OOM:java.lang.OutOfMemoryError
1.1 堆内存溢出
堆内存(Heap Space)没有足够空间存放新创建的对象
java.lang.OutOfMemoryError:Javaheap space
原因:
-
请求创建一个
超大对象
,通常是一个大数组。 -
超出预期的访问量/数据量,通常是上游系统
请求流量飙升
,常见于各类促销/秒杀活动,可以结合业务流量指标排查是否有尖状峰值。 -
过度使用终结器(Finalizer),该对象没有立即被 GC。
-
内存泄漏
(Memory Leak),大量对象引用没有释放,JVM 无法对其自动回收,常见于使用了 File 等资源没有回收
。
方案:
针对大部分情况,通常只需要通过 -Xmx 参数
调高 JVM 堆内存空间即可。如果仍然没有解决,可以参考以下情况做进一步处理:
-
如果是超大对象,可以检查其合理性,比如是否一次性查询了数据库全部结果,而没有
做结果数限制
。 -
如果是业务峰值压力,可以考虑添加机器资源,或者做
限流降级
。 -
如果是内存泄漏,需要找到持有的对象,修改代码设计,比如
关闭没有释放的连接
。
1.2 GC投入产出比低
应用程序已经基本耗尽了所有可用内存, GC 也无法回收。
当 Java 进程花费 98% 以上的时间执行 GC,但只恢复了不到 2% 的内存,且该动作连续重复了 5 次:
java.lang.OutOfMemoryError:GC overhead limit exceeded
1.3 永久代(或元空间 JDK1.8)溢出
永久代(Permanent Generation)(或Metaspace JDK1.8)已用满,通常是因为加载的 class 数目太多或体积太大。
永久代存储对象:
- 加载/缓存到内存中的 class 定义,包括类的名称,字段,方法和字节码;
- 常量池;
- 对象数组/类型数组所关联的 class;
- JIT 编译器优化后的 class 信息。
方案:
-
程序启动报错,修改
-XX:MaxPermSize
启动参数,调大永久代空间。 -
应用重新部署时报错,很可能是加载了多份 class 信息,只需
重启 JVM
即可解决。 -
运行时报错,应用程序可能会动态创建大量 class,而这些 class 的生命周期很短暂,但是 JVM 默认不会卸载 class,可以设置
-XX:+CMSClassUnloadingEnabled 和 -XX:+UseConcMarkSweepGC
这两个参数允许 JVM 卸载 class。
如果上述方法无法解决,可以通过 jmap 命令 dump 内存对象 jmap-dump:format=b,file=dump.hprof ,然后利用 Eclipse MAT https://www.eclipse.org/mat 功能逐一分析开销最大的 classloader 和重复 class。
1.4 无法创建一个新native线程
每个 Java 线程都需要占用一定的内存空间,当 JVM 向底层操作系统请求创建一个新的 native 线程时,如果没有足够的资源分配就会报此类错误。
java.lang.OutOfMemoryError:Unableto createnewnativethread
原因:
-
线程数超过操作系统最大线程数 ulimit 限制;
-
线程数超过 kernel.pid_max(只能重启);
-
native 内存不足;
方案:
-
升级配置,为机器提供更多的
内存
; -
降低 Java
Heap
Space 大小; -
修复
应用程序的线程泄漏
问题; -
限制线程池大小
; -
使用
-Xss
参数减少线程栈的大小; -
调高 OS 层面的
线程最大数
:执行 ulimia-a 查看最大线程数限制,使用 ulimit-u xxx 调整最大线程数限制。ulimit -a … 省略部分内容 … max user processes (-u) 16384
1.5 虚拟内存溢出
可用的虚拟内存已被耗尽。
虚拟内存(Virtual Memory)由物理内存(Physical Memory)和交换空间(Swap Space)两部分组成。
当运行时程序请求的虚拟内存溢出时就会报错。
Out of swap space
原因:
地址空间不足
;物理内存已耗光
;- 应用程序的
本地内存泄漏
(native leak),例如不断申请本地内存,却不释放。 - 执行 jmap-histo:live 命令,强制执行 Full GC;如果几次执行后内存明显下降,则基本确认为 Direct ByteBuffer 问题。
方案:
-
升级地址空间
为 64 bit; -
使用 Arthas 检查是否为 Inflater/Deflater 解压缩问题,如果是,则
显式调用 end
方法。 -
Direct ByteBuffer 问题可以通过启动参数
-XX:MaxDirectMemorySize
调低阈值。 -
升级服务器配置/隔离部署,避免争用。