Mycat心跳机制梳理

1、Mycat心跳检测
1) NIOProcessor 定时检测后端连接,侧重点,连接是否超时等等,见io.mycat.MycatServer

定时任务执行频率:processorCheckPeriod,默认值,1s执行一次

 

关键代码:
// 后端连接检查
private void backendCheck() {
		long sqlTimeout = MycatServer.getInstance().getConfig().getSystem().getSqlExecuteTimeout() * 1000L;
		Iterator<Entry<Long, BackendConnection>> it = backends.entrySet().iterator();
		while (it.hasNext()) {
			BackendConnection c = it.next().getValue();

			// 删除空连接
			if (c == null) {
				it.remove();
				continue;
			}
			// SQL执行超时的连接关闭
			if (c.isBorrowed() && c.getLastTime() < TimeUtil.currentTimeMillis() - sqlTimeout) {
				LOGGER.warn("found backend connection SQL timeout ,close it " + c);
				c.close("sql timeout");
			}

			// 清理已关闭连接,否则空闲检查。
			if (c.isClosed()) {
				it.remove();

			} else {
				// very important ,for some data maybe not sent
				if (c instanceof AbstractConnection) {
					checkConSendQueue((AbstractConnection) c);
				}
				c.idleCheck();
			}
		}
	}
2)DataHost中空闲连接心跳检测
检测频率:dataNodeIdleCheckPeriod,默认值:5分钟,见io.mycat.MycatServer
关键代码:
for (PhysicalDBPool node : nodes.values()) {
node.heartbeatCheck(heartPeriod);
}
PhysicalDatasource.heatBeatCheck
上述代码主要就是遍历ConQueue(Mycat后端连接池存放的地方),选出需要进行心跳的连接,然后执行conHeartBeatHandler.doHeartBeat。
重点关注一下检测checkIfNeedHertBeat方法:
private void checkIfNeedHeartBeat(
			LinkedList<BackendConnection> heartBeatCons, ConQueue queue,
			ConcurrentLinkedQueue<BackendConnection> checkLis,
			long hearBeatTime, long hearBeatTime2) {
		int maxConsInOneCheck = 10;
		Iterator<BackendConnection> checkListItor = checkLis.iterator();
		while (checkListItor.hasNext()) {
			BackendConnection con = checkListItor.next();   // @1
			if (con.isClosedOrQuit()) {
				checkListItor.remove();
				continue;
			}
			if (validSchema(con.getSchema())) {
				if (con.getLastTime() < hearBeatTime
						&& heartBeatCons.size() < maxConsInOneCheck) {
					checkListItor.remove(); // @2
					// Heart beat check
					con.setBorrowed(true);
					heartBeatCons.add(con);    // @3
				}
			} else if (con.getLastTime() < hearBeatTime2) {
				// not valid schema conntion should close for idle
				// exceed 2*conHeartBeatPeriod
				checkListItor.remove();
				con.close(" heart beate idle ");
			}

		}

	}
上面的逻辑是,获取ConQueue中的所有连接(ConcurrentLinkedQueue<BackendConnection>),然后获取一个遍历器,
进行遍历,然后判断该连接是否需要加入到心跳检测中,如果符合,就先移除,然后加入到待检测列表中。
上述这个步骤,乍一看没什么问题,但如果你与获取连接一起考虑,就会发现问题,我们知道,获取连接,也是从ConQueue的(ConcurrentLinkedQueue<BackendConnection>中poll一个,这样就会产生这样一个问题,对于一个连接c,有可能放入到检测列表中,并同时分配给其他线程,造成一个连接,在同一时间,会又做心跳检测,又执行其他SQL,造成结果混乱。
分析上述代码出现场景:
t1 线程运行到代码@1,t2线程获取数据库连接,使用poll()方法,获取一个连接,有可能就是获取的这个连接正好与t1代码@1的连接一样,
然后t1运行到代码@2,将移除,但并不会返回成功与否,然后运行代码@3,将连接放入到待检测列表中,此时一个连接,同时被多个线程使用,并且,最后一个使用,会改变连接的响应处理器,造成第二个线程的响应处理器会获得第一个线程的响应结果。
3)检测频率:dataNodeHeartbeatPeriod,默认值10s,见io.mycat.MycatServer 【验证数据节点是否正常】,也就是readhost,writerhost的存活状态检测。

 

关键代码:MySQLDetector

 

 

 

 

 

上述代码引起了我一个疑问,为什么heartbeat方法没调用一次,就要新建一个SQLJob对象,为什么嗯?
我们先重点看一下看一下该方法的调用链:

 

 

 

 

一个PhysicalDatasource对应一个readerhost或writerhost。
跟踪代码发现,PhysicalDatasource拥有一个(private DBHeartbeat heartbeat),一个MySQLHeartbeat拥有一个MySQLDetector,
那为什么执行MySQLDetector时,确需要将SQLJob声明为volatile,并没次调用都新建一个对象,估计是因为每次心跳检查都需要一个独立的
OneRawSQLQueryResultHandler resultHandler = new OneRawSQLQueryResultHandler( fetchColms, this);故这里每次都新建了SQLJob。
此处,应该有一个可优化 的点:由于心跳连接运行比较频繁,默认10s一次,故此处连接的重用性问题值得思考。
上述BUG,是由我公司生产环境下跑出的,因为项目组反映,一条查询连接,竟然返回了心跳检测的响应结果:

 

 

 

 

附上本次代码修改后的代码:
PhysicalDatasource.checkIfNeedHeartBeat
private void checkIfNeedHeartBeat(
			LinkedList<BackendConnection> heartBeatCons, ConQueue queue,
			ConcurrentLinkedQueue<BackendConnection> checkLis,
			long hearBeatTime, long hearBeatTime2) {
		int maxConsInOneCheck = 10;
		Iterator<BackendConnection> checkListItor = checkLis.iterator();
		while (checkListItor.hasNext()) {
			BackendConnection con = checkListItor.next();
			if (con.isClosedOrQuit()) {
				checkListItor.remove();
				continue;
			}
			if (validSchema(con.getSchema())) {
				if (con.getLastTime() < hearBeatTime
						&& heartBeatCons.size() < maxConsInOneCheck) {
					
					if(checkLis.remove(con)) { 
						//如果移除成功,则放入到心跳连接中,如果移除失败,说明该连接已经被其他线程使用,忽略本次心跳检测
						con.setBorrowed(true);
						heartBeatCons.add(con);
					}
//					checkListItor.remove();
//					// Heart beat check
//					con.setBorrowed(true);
//					heartBeatCons.add(con);
					
				}
			} else if (con.getLastTime() < hearBeatTime2) {
				// not valid schema conntion should close for idle
				// exceed 2*conHeartBeatPeriod
//				checkListItor.remove();
//				con.close(" heart beate idle ");
				
				// 同样,这里也需要先移除,避免被业务连接
				if(checkLis.remove(con)) { 
					con.close(" heart beate idle ");
				}
			}

		}

	}

本文主要梳理一下Mycat主要心跳逻辑,修复了一个并发BUG,对SQLJob的优化目前还在思考中,改动代码会比较多。

欢迎加笔者微信号(dingwpmz),加群探讨,笔者优质专栏目录:

1、源码分析RocketMQ专栏(40篇+)
2、源码分析Sentinel专栏(12篇+)
3、源码分析Dubbo专栏(28篇+)
4、源码分析Mybatis专栏
5、源码分析Netty专栏(18篇+)
6、源码分析JUC专栏
7、源码分析Elasticjob专栏
8、Elasticsearch专栏
9、源码分析Mycat专栏

 

Mycat心跳不正常可能导致一些问题。根据引用\[1\]中的描述,当一台主机宕机时,Mycat应该通过心跳判断出主机宕机,并将写操作转移到对应的备机上。然而,引用中提到的问题是,虽然Mycat能够快速检测到连接断开,但整体恢复速度较慢,并且导致了其他主从连接出现超时异常。 根据引用\[2\]中的解释,Mycat的读写分离是基于主从关系的。当一个从属于某个主时,如果该主宕机,从也将停止工作,因为此时从的数据已经不可靠。为了支持MySQL一主一从的标准配置,并且在主节点宕机的情况下,从节点仍能读取数据,需要在Mycat中配置两个writeHost并设置balance=1。 因此,如果Mycat心跳不正常,可能是由于配置问题导致的。你可以检查Mycat的配置文件schema.xml(引用\[3\])中的逻辑库、表、分片规则、DataNode以及DataSource的配置是否正确。另外,确保正确配置了两个writeHost并设置了balance=1,以支持主从切换。 如果问题仍然存在,可能需要进一步检查Mycat的日志文件以获取更多详细信息,并考虑与Mycat的开发者或社区寻求帮助。 #### 引用[.reference_title] - *1* [Mycat 主机挂了心跳检测异常](https://blog.csdn.net/weixin_35662493/article/details/113936218)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* *3* [MyCat介绍和使用](https://blog.csdn.net/JackRen_Developer/article/details/108992385)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

中间件兴趣圈

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值