redission使用的那些坑-hash结构

故障现象: 应用隔2-3天就回导致一次CPU飙到600%+(容器,宿主8核),随后宕机。

排查过程:

首先明确CPU飙升原因

第一步: top -Hp 查看占用CPU进程

发现13~20线程占用大量CPU资源

第二步: jstack 查看实际占用cpu的进程(与top命令中线程关系nid(hex)=pid(dec))

发现CPU占用方均为GC线程。

第三步: jstat -gcutil 查看gc执行情况,发现

  • Old区占用达100%
  • 在频繁的执行Full GC操作
  • 每次Full GC操作几乎释放不出Old区空间
  • 确认代码中的确没有System.GC()显式操作

结合此时old区占用已经达到99.9%,基本可以确定是内存占满导致频繁的FullGC,CPU高居不下,最后响应异常,被健康检查进程杀掉。

进一步分析堆栈,查找FullGC诱因,

第四步: dump堆分析,内存占用按数量分布如下

其中,如下几类数量上十分可疑,


    
    
  1. java.util.LinkedList$Node
  2. java.util.concurrent.ConcurrentHashMap$Node
  3. java.util.LinkedList
  4. io.netty.util.concurrent.ScheduledFutureTask
  5. io.netty.util.concurrent.PromiseTask$RunnableAdapter
  6. org.redisson.eviction.MapCacheEvictionTask
  7. 复制代码

从数量上,基本可以认为是同一个根导致的级联泄露,关联分析,情况属实.

源码级排查,深层分析原因,

第五步: Redisson源码排查 应用中大量使用了Redisson客户端(Redisson implements RedissonClient)的getMapCache方法,生成了大量的RedissonMapCache(RMapCache)对象(RedissonClient->getMapCahce)。

而Redisson对象恰恰是EvictionScheduler的持有者,依赖路径 Redisson -> EvictionScheduler -> C-HashMap ->Node -> MapCacheEvictionTask -> LinkedList(sizeHistory)。

但是实际排查中,RedissonMapCache的数量并没有泄露,原因在于EvictionScheduler是RedissonClient持有,注入给RedissonMapCache的,虽然RedissonMapCache生命周期结束后被gc回收了,但是EvictionScheduler持有的大量task,并没有被释放,需要手工显式调用destory释放。

此外,一个EvictionScheduler会同时占用6个字符串,这也解释了String类型变了数量为827(~136万 * 6)万的原因。而char[]类型中,占比99%均是EvictionTask所持有的那些真实字符。

第六步: try to fix 由前面分析得知,造成泄露的根源就是EvictionScheduler->tasks属性持有的Task造成了相关数据(主要是redisson自用的key串)引用无法释放。 RMapCache的擦除调度机制(EvictionScheduler工作机制参见https://github.com/redisson/redisson/wiki/7.-distributed-collections#eviction);

此问题,可使用RedissonMapCache->destory方法可以显式移除task。

第七步: 验证->失败,同样泄露,,,继续分析::: 但是,此时EvictionScheduler->tasks列表中,元素确实已经变空,也就是说由tasks导致的泄露已经通过RedissonMapCache->destory方法消除。

并且,dump后查看MapCacheEvictionTask的数量,的确降低了很多,并且现存的MapCacheEvictionTask里面,绝大部分元素均没有再被EvictionScheduler->tasks持有。说明上面的destroy()确实对其释放有帮助。如图:

但是ScheduleFutureTask&PromiseTask相关对象并未释放,联想到前面 Redisson的Eviction机制,猜测是RMapCache进行擦除(过期)任务导致在netty调度时,出现:

  1. RMapCache过期前,netty仍然会持有MapCacheEvictionTask(275973个),此时虽然Redisson这边不在泄露task,但是如果请求很密集,光redisson的key占用的字符空间,就有可能占满jvm堆空间,如下图,此时jvm Old区占用已达90%+。

但是庆幸的是,这种情况下,执行一次FGC基本可以释放出大量空间(99.9%时执行了一次FGC,Old区释放了40%+多的空间):

  1. ScheduleFutureTask及PromiseTask在netty执行调度时,本身任务管理上也存在问题,大量的任务(ScheduledFutureTask/PromiseTask)占用着内存空间。 (redisson的EvictionScheduler其实是把任务交给netty的NioEventLoopGroup进行调度) (代码路径: redissonClient::getMapCache new RedissonMapCache evictionScheduler.schedule() new MapCacheEvictionTask -> put it to EvictionScheduler.tasks MapCacheEvitionTask.schedule() ConnectionManager->getExcutor() get EventLoopGroup ->schdule [netty的NioEventLoopGroup]开始调度 )

如下图展示的对象引用关系,NioEventLoop持有了大量的Task造成了内存负担。

--目前为止,此问题,未找到redisson相关高级接口手动释放下放到netty层面的task对象。 决定使用RMap替代RMapCache,不使用redisson的Eviction功能。

使用RMap代替RMapCache,更新应用后,故障解除。

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Redisson是一个基于RedisJava驻留内存数据网格(In-Memory Data Grid)和分布式锁,它提供了一致性哈希算法来实现数据的分片和负载均衡。 使用Redisson的一致性哈希算法,可以将数据分散存储在多个Redis节点上,以实现数据的分布式存储和访问。一致性哈希算法通过将数据的键映射到一个哈希环上的位置来确定数据应该存储在哪个节点上。当需要访问数据时,Redisson会根据键的哈希值找到对应的节点,并从该节点上获取数据。 下面是使用Redisson的一致性哈希算法进行数据存储和访问的示例: ```java // 创建Redisson客户端 Config config = new Config(); config.useSingleServer().setAddress("redis://127.0.0.1:6379"); RedissonClient redisson = Redisson.create(config); // 获取一致性哈希对象 RMap<String, String> map = redisson.getMap("myMap"); // 存储数据 map.put("key1", "value1"); map.put("key2", "value2");map.put("key3", "value3"); // 访问数据 String value1 = map.get("key1"); String value2 = map.get("key2"); String value3 = map.get("key3"); // 关闭Redisson客户端 redisson.shutdown(); ``` 在上述示例中,我们首先创建了一个Redisson客户端,并通过该客户端获取了一个分布式Map对象。然后,我们使用一致性哈希算法将数据存储在多个Redis节点上,并通过键来访问数据。 使用Redisson的一致性哈希算法,可以实现数据的分布式存储和访问,提高系统的性能和可扩展性。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值