关键字:
KingbaseES、JDBC、读写分离、人大金仓、KingbaseES
环境要求
KESV9R1版本数据库、IDEA软件
背景描述
KES的JDBC读写分离集群监控线程,在创建检测连接时,会更新连接的版本,版本更新会导致旧版本的指令执行失效。每当出现线程运行异常,检测连接都会被关闭。然而,当网络延迟高时,监控线程频繁会频繁出现因数据获取超时,导致的连接关闭与重建,不仅造成了资源的浪费,也会使业务代码出现频繁报错的异常。上述问题的解决方法之一,是新增集群监控线程的多次重试功能,延长集群运行状态的判断时间。
异常信息
在KESV9R1版本数据库中,可以发现,底层出现数据获取超时的异常类型是socketTimeoutException。该异常被上层捕获,并包装为IOException。监控线程中捕获到的异常类型是SQLException,其详细信息如下图所示,底层的异常信息为read timed out。
网络超时后SQLException的具体内容
多次重试功能的具体设计及实现
集群监控线程的多次重试功能,可以通过新增标志变量来实现。在集群监控线程所在的ConnectionMangerV2类中,新增monitor_wait变量,该值可从Property中获取默认值,也可通过连接参数传递,并可用于识别多次重试功能是否启动。
下图展示了集群监控线程的多次重试功能的具体设计,在运行正常的检测过程中,monitor_wait等于初始值时,表示未启动多次重试,此时连接重建时不更新连接版本。当出现异常时,检测monitor_wait变量的值:大于0表示可以启动多次重试功能;等于0表示不可启动多次重试功能,或已经达到重试次数上限。此外,正常检测结束、其他异常发生和重试次数为0等情况,都需要重置monitor_wait为初始值,以保证多次重试功能的正常使用。
集群监控线程的多次重试功能设计图
下图展示了基于上述设计思路,完成的代码编写工作的主要代码详情。Monitor_wait的默认值是5,表示可以进行5次重试。
参考文档:
无