一,问题
项目中使用SpringCloud Gateway作为网关路由,最近在开发和测试环境偶发OOM的问题,项目通过K8s部署,把OOM时的日志拉下来,发现有以下问题日志。
[reactor-http-epoll-4] [ERROR] [reactor.core.publisher.Operators] [324] - [PLATFORM-GATEWAY,xxxx,xxx] Operator called default onErrorDropped reactor.netty.ReactorNetty$InternalNettyException: java.lang.OutOfMemoryError: Cannot reserve 4194304 bytes of direct buffer memory (allocated: 256330613, limit: 259522560) Suppressed: reactor.core.publisher.FluxOnAssembly$OnAssemblyException
二,解决方法
1,定位问题
看日志是netty相关,netty在springcloud gateway里有使用到,可以直接定位到gateway代码部分,而且是和flux相关。
2,知识点
(1)JVM内存模型
(1)JVM 直接内存(Direct Buffer Memory)
直接内存使用的是系统内存,java nio使用native函数获得堆外内存;
使用DirectByteBuffer对这块内存进行引用,避免了heap堆与堆外内存的复制;
直接内存的申请相较堆内存慢,但是访问速度较快,对频繁使用的空间,使用直接内存可提升效率;
(2)-XX:MaxDirectMemorySize:设置直接内存的大小,默认等于-Xmx的值。
当堆、栈、直接内存、虚拟机使用内存任一项达到系统内存后,就会抛出OutOfMemoryError;
对直接内存设置合理的最大值,进行垃圾回收,可减少内存空间不足错误。
(3)JVM的GC回收堆外内存(如直接内存)需要使用引用来定位堆内存和堆外内存的关系。
3,代码
4,注意点
注意点1:
在实际使用DirectByteBuffer 时要避免把内存使用完,但是在实际操作中我们可能不知道堆外内存还剩余多少,因此我们可以在JVM中通过参数控制,通过JVM参数 -XX:MaxDirectMemorySize 指定堆外内存的上限大小,当超过指定的内存上限大小时,会主动触发一次Full GC进行回收内存。
注意点2:
通过DirectByteBuffer 分配内存时,可能会出现分配内存不够的情况,因此JVM如果发现堆外内存分配不足时,也会主动发起一次GC,只不过这次GC是通过System.gc() 实现的强制GC,但是在实际生产环境中我们都是通过JVM参数 -XX:+DisableExplicitGC,禁止使用System.gc()的,因此在实际使用过程中一定要注意分配内存的情况,避免出现内存泄漏。