点击上方“芋道源码”,选择“设为星标”
做积极的人,而不是积极废人!
源码精品专栏
来源:https://dwz.cn/redirect/REEezWaH
背景
分析
解决
背景
上周有小伙伴反馈zk连接很慢。整理出zk连接的关键逻辑如下:
![](https://i-blog.csdnimg.cn/blog_migrate/8f1697f7d4de82fb6d93d0573f5184e1.png)
上面的代码造成第一次调用ClientZkAgent.getInstance
的时候,需耗时10s, 这个时间恰好跟semaphore
的超时时间相当. 在此期间,整个世界好像停滞了一样。
分析
在本地重现后,通过jstack
获得系统停滞期间的线程栈,发现这个时候zookeeper
的EventThread
有个比较奇怪的现象:
![](https://i-blog.csdnimg.cn/blog_migrate/8543f37f88013e26d7074c61a09a3765.png)
客户端实际上很快就连上了zookeeper
并返回后生成了SyncConnected
事件,而且EventThread
已经在回调Watcher.process
方法了,但似乎事件线程就一直hold在上面#_1
的位置无法往下走, 同时,lambda表达式变成了ClientZkAgent
的一个方法了:lambda$connect$0
。
了解了一下Java中lambda的实现方式,事情水落石出了。
简而言之,jvm会把lambda表达式转换成所在类的一个方法lambda${method}${seq}
(method为该lambda所在的方法名,例如上面的connect方法),同时通过动态代理生成一个代理类(该代理类实现了lambda表达式所代表的具体接口),在该代理类中调用lambda${method}${seq}
。
在上面的例子中,生成的代理类大概如下:
![](https://i-blog.csdnimg.cn/blog_migrate/18cd7c0d223fb46af3cd7b971af3b77b.png)
再梳理一下:
业务线程:
1.通过静态方法ClientZkAgent.getInstance()
获取实例,第一次访问的时候会触发类ClientZkAgent
的装载。
2.装载过程中,装载静态成员instance,这时候会尝试创建一个ClientZkAgent
对象。
3.在ClientZkAgent
的构造函数中连接zk,并通过CountdownLatch
进入阻塞状态。注意这时候类装载还没完成。
4.CountdownLatch
超时后完成对象的初始化以及整个类的加载
zk事件线程:
SyncConnected
事件触发后,调用ClientZkAgent.lambda$connect$0(event)
, 试图唤醒业务线程(唤醒逻辑在lambda中)。
然而这时候ClientZkAgent
还没加载完,事件线程只能等待类加载流程的结束。
业务线程加载完ClientZkAgent
后,事件线程完成事件的处理。
可见,在这个过程中,两个线程相互等待(类似死锁但不是死锁),直至业务线程超时后才化解这个局面。
解决
修改ClientZkAgent的初始化逻辑如下:
![](https://i-blog.csdnimg.cn/blog_migrate/471003861cb4755841210af7f2d8fd8f.png)
欢迎加入我的知识星球,一起探讨架构,交流源码。加入方式,长按下方二维码噢:
已在知识星球更新源码解析如下:
如果你喜欢这篇文章,喜欢,转发。
生活很美好,明天见(。・ω・。)ノ♡