canal如果不实现HA,也可以运行,此时不需要zookeeper。如果canal 需要实现HA,需要依赖zookeeper,核心配置如:canal.zkServers = master:2181,slave1:2181,slave2:2181,该配置在后面的章节有讲解。
做实时计算,一般通过Spark或者Flink 去实时消费kafka中的数据,实时计算没有客户端,要么写Flink代码,要么写Flink SQL。
canal集群搭建依赖zookeeper集群,如果数据需要实时计算,canal需要将采集的数据写入kafka,然后才能做实时计算。
这里的canal 客户端只是测试,canal 工具是否能从数据库采集到了数据,实际工作中,canal客户端就可能是 spark 应用或者flink 应用。