Canal源码分析之instance模块

在上一节server模块源码分析中,我们提到CanalServerWithNetty封装了一层网络请求协议,将请求委派给CanalServerWithEmbedded处理。CanalServerWithEmbedded会根据请求携带的destination参数,选择对应的CanalInstance来真正的处理请求。这正是一步一步抽丝剥茧的过程,在本节中,我们将要分析CanalInstance的源码。

1 CanalInstance源码概览

CanalInstance相关代码位于canal源码的instance模块中,这个模块又有三个子模块,如下所示: 

    在core模块中,定义了CanalInstance接口,以及其抽象类子类AbstractCanalInstance

    在spring模块,提供了基于spring配置方式的CanalInstanceWithSpring实现,即CanalInstance实例的创建,通过spring配置文件来创建。

    在manager模块中,提供了基于manager配置方式的CanalInstanceWithManager实现,即CanalInstance实例根据远程配置中心的内容来创建。

CanalInstance类图继承关系如下所示: 

在本节中,我们主要以spring配置方式为例,对CanalInstance源码进行解析。

2 CanalInstance接口

在Canal官方文档中有一张图描述了CanalInstance的4个主要组件,如下: 

其中:

event parser:数据源接入,模拟slave协议和master进行交互,协议解析

event sink:parser和store链接器,进行数据过滤,加工,分发的工作

event store:数据存储

meta manager:增量订阅/消费binlog元数据位置存储

 在CanalInstance接口中,主要就是定义了获得这几个组成部分的方法:

  1. public interface CanalInstance extends CanalLifeCycle {
  2.   //这个instance对应的destination
  3.     String getDestination();
  4.   //数据源接入,模拟slave协议和master进行交互,协议解析,位于canal.parse模块中
  5.     CanalEventParser getEventParser();
  6.   //parser和store链接器,进行数据过滤,加工,分发的工作,位于canal.sink模块中
  7.     CanalEventSink getEventSink();
  8.   //数据存储,位于canal.store模块中
  9.     CanalEventStore getEventStore();
  10.   //增量订阅&消费元数据管理器,位于canal.meta模块中
  11.     CanalMetaManager getMetaManager();
  12.   
  13.   //告警,位于canal.common块中
  14.     CanalAlarmHandler getAlarmHandler();
  15.     /**     * 客户端发生订阅/取消订阅行为     */   
  16.    boolean subscribeChange(ClientIdentity identity);
  17. }

     可以看到,instance模块其实是把这几个模块组装在一起,为客户端的binlog订阅请求提供服务。有些模块都有多种实现,不同组合方式,最终确定了一个CanalInstance的工作逻辑。

CanalEventParser接口实现类:

        MysqlEventParser:伪装成单个mysql实例的slave解析binglog日志

        GroupEventParser:伪装成多个mysql实例的slave解析binglog日志。内部维护了多个CanalEventParser。主要应用场景是分库分表:比如产品数据拆分了4个库,位于不同的mysql实例上。正常情况下,我们需要配置四个CanalInstance。对应的,业务上要消费数据时,需要启动4个客户端,分别链接4个instance实例。为了方便业务使用,此时我们可以让CanalInstance引用一个GroupEventParser,由GroupEventParser内部维护4个MysqlEventParser去4个不同的mysql实例去拉取binlog,最终合并到一起。此时业务只需要启动1个客户端,链接这个CanalInstance即可.

        LocalBinlogEventParser:解析本地的mysql binlog。例如将mysql的binlog文件拷贝到canal的机器上进行解析。

CanalEventSink接口实现类:

        EntryEventSink

        GroupEventSink:基于归并排序的sink处理

CanalEventStore接口实现类:

        目前只有MemoryEventStoreWithBuffer,基于内存buffer构建内存memory store

CanalMetaManager:

        ZooKeeperMetaManager:将元数据存存储到zk中

        MemoryMetaManager:将元数据存储到内存中

        MixedMetaManager:组合memory + zookeeper的使用模式

        PeriodMixedMetaManager:基于定时刷新的策略的mixed实现

        FileMixedMetaManager:先写内存,然后定时刷新数据到File

    关于这些实现的具体细节,我们在相应模块的源码分析时,进行讲解。目前只需要知道,一些组件有多种实现,因此组合工作方式有多种。

3 AbstractCanalInstance源码分析

      AbstractCanalInstance是CanalInstance的抽象子类,定义了相关字段来维护eventParser、eventSink、eventStore、metaManager的引用。

  1. public class AbstractCanalInstance extends AbstractCanalLifeCycle implements CanalInstance {
  2.     private static final Logger logger = LoggerFactory.getLogger(AbstractCanalInstance.class);
  3.     protected Long canalId;                                     // 和manager交互唯一标示
  4.     protected String destination;                               // 队列名字
  5.     protected CanalEventStore<Event> eventStore;                // 有序队列
  6.     protected CanalEventParser eventParser;                     // 解析对应的数据信息
  7.     protected CanalEventSink<List<CanalEntry.Entry>> eventSink; // 链接parse和store的桥接器
  8.     protected CanalMetaManager metaManager;                     // 消费信息管理器
  9.     protected CanalAlarmHandler alarmHandler;                   // alarm报警机制
  10.     //...
  11. }

    需要注意的是,在AbstractCanalInstance中,并没有提供方法来初始化这些字段。可以看到,这些字段都是protected的,子类可以直接访问,显然这些字段都是在AbstractCanalInstance的子类中进行赋值的。

    AbstractCanalInstance不关心这些字段的具体实现,只是从接口层面进行调用。对于其子类而言,只需要给相应的字段赋值即可。在稍后我们将要讲解的CanalInstanceWithSpring中,你将会发现其仅仅给eventParser、eventSink、eventStore、metaManager几个字段赋值,其他什么工作都没干。

    因此,对于instance模块而言,其核心工作逻辑都是在AbstractCanalInstance中实现的。

3.1 start方法和stop方法:

start方法:

    在AbstractCanalInstance的start方法中,主要就是启动各个模块。启动顺序为:metaManager—>eventStore—>eventSink—>eventParser。

源码如下所示:

com.alibaba.otter.canal.instance.core.AbstractCanalInstance#start

  1. public void start() {
  2.         super.start();
  3.         if (!metaManager.isStart()) {
  4.             metaManager.start();
  5.         }
  6.         if (!alarmHandler.isStart()) {
  7.             alarmHandler.start();
  8.         }
  9.         if (!eventStore.isStart()) {
  10.             eventStore.start();
  11.         }
  12.         if (!eventSink.isStart()) {
  13.             eventSink.start();
  14.         }
  15.         if (!eventParser.isStart()) {
  16.             beforeStartEventParser(eventParser);//启动前执行一些操作
  17.             eventParser.start();
  18.             afterStartEventParser(eventParser);//启动后执行一些操作
  19.         }
  20.         logger.info("start successful....");
  21.     }

 要理解为什么按照这个顺序启动很简单。官方关于instance模块构成的图中,把metaManager放在最下面,说明其是最基础的部分,因此应该最先启动。

    而eventParser依赖于eventSink,需要把自己解析的binlog交给其加工过滤,而eventSink又要把处理后的数据交给eventStore进行存储。因此依赖关系如下:eventStore—>eventSink—>eventParser ,启动的时候也要按照这个顺序启动。

stop方法:

在停止的时候,实际上就是停止内部的各个模块,模块停止的顺序与start方法刚好相反

com.alibaba.otter.canal.instance.core.AbstractCanalInstance#stop

  1. @Override    
  2. public void stop() {
  3.         super.stop();
  4.         logger.info("stop CannalInstance for {}-{} ", new Object[] { canalId, destination });
  5.         if (eventParser.isStart()) {
  6.             beforeStopEventParser(eventParser);//停止前执行一些操作
  7.             eventParser.stop();
  8.             afterStopEventParser(eventParser);//停止后执行一些操作
  9.         }
  10.         if (eventSink.isStart()) {
  11.             eventSink.stop();
  12.         }
  13.         if (eventStore.isStart()) {
  14.             eventStore.stop();
  15.         }
  16.         if (metaManager.isStart()) {
  17.             metaManager.stop();
  18.         }
  19.         if (alarmHandler.isStart()) {
  20.             alarmHandler.stop();
  21.         }
  22.         logger.info("stop successful....");
  23.     }

3.2 start和stop方法对eventParser的特殊处理

     在AbstractCanalInstance的start和stop方法,对于eventParser这个组件的启动和停止,都有一些特殊处理,以下是相关代码片段:

  1. --start方法
  2. beforeStartEventParser(eventParser);//启动前执行一些操作
  3. eventParser.start();
  4. afterStartEventParser(eventParser);//启动后执行一些操作
  5. --stop方法
  6. beforeStopEventParser(eventParser);//停止前执行一些操作
  7. eventParser.stop();
  8. afterStopEventParser(eventParser);//停止后执行一些操作

    这与eventParser的自身构成有关系。canal官方文档DevGuide中,关于eventParser有以下描述:

因此,eventParser在启动之前,需要先启动CanalLogPositionManagerCanalHAController

    关于CanalLogPositionManager,做一点补充说明。

    mysql在主从同步过程中,要求slave自己维护binlog的消费进度信息。canal伪装成slave,因此也要维护这样的信息。

    事实上,如果读者自己搭建过mysql主从复制的话,在slave机器的data目录下,都会有一个master.info文件,这个文件的作用就是存储主库的消费binlog解析进度信息。

beforeStartEventParser方法

   beforeStartEventParser方法的作用是eventParser前做的一些特殊处理。首先会判断eventParser的类型是否是GroupEventParser,在前面我已经介绍过,这是为了处理分库分表的情况。如果是,循环其包含的所有CanalEventParser,依次调用startEventParserInternal方法;否则直接调用com.alibaba.otter.canal.instance.core.AbstractCanalInstance#beforeStartEventParser

  1. protected void beforeStartEventParser(CanalEventParser eventParser) {
  2.     //1、判断eventParser的类型是否是GroupEventParser
  3.     boolean isGroup = (eventParser instanceof GroupEventParser);
  4.     //2、如果是GroupEventParser,则循环启动其内部包含的每一个CanalEventParser,依次调用startEventParserInternal方法
  5.     if (isGroup) {
  6.         // 处理group的模式
  7.         List<CanalEventParser> eventParsers = ((GroupEventParser) eventParser).getEventParsers();
  8.         for (CanalEventParser singleEventParser : eventParsers) {// 需要遍历启动
  9.             startEventParserInternal(singleEventParser, true);
  10.         }
  11.     //如果不是,说明是一个普通的CanalEventParser,直接调用startEventParserInternal方法   
  12.     } else {
  13.         startEventParserInternal(eventParser, false);
  14.     }
  15. }

    从上面的分析中,可以看出,针对单个CanalEventParser,都是通过调用startEventParserInternal来启动的,其内部会启动CanalLogPositionManager和CanalHAController。

com.alibaba.otter.canal.instance.core.AbstractCanalInstance#startEventParserInternal

  1. /**
  2. * 初始化单个eventParser,不需要考虑group
  3. */
  4. protected void startEventParserInternal(CanalEventParser eventParser, boolean isGroup) {
  5.     // 1 、启动CanalLogPositionManager
  6.     if (eventParser instanceof AbstractEventParser) {
  7.         AbstractEventParser abstractEventParser = (AbstractEventParser) eventParser;
  8.         CanalLogPositionManager logPositionManager = abstractEventParser.getLogPositionManager();
  9.         if (!logPositionManager.isStart()) {
  10.             logPositionManager.start();
  11.         }
  12.     }
  13.     // 2 、启动CanalHAController
  14.     if (eventParser instanceof MysqlEventParser) {
  15.         MysqlEventParser mysqlEventParser = (MysqlEventParser) eventParser;
  16.         CanalHAController haController = mysqlEventParser.getHaController();
  17.         if (haController instanceof HeartBeatHAController) {
  18.             ((HeartBeatHAController) haController).setCanalHASwitchable(mysqlEventParser);
  19.         }
  20.         if (!haController.isStart()) {
  21.             haController.start();
  22.         }
  23.     }
  24. }

关于CanalLogPositionManager和CanalHAController的详细源码,我们将会在分析parser模块的时候进行介绍

afterStartEventParser方法

    在eventParser启动后,会调用afterStartEventParser方法。这个方法内部主要是通过metaManager读取一下历史订阅过这个CanalInstance的客户端信息,然后更新一下filter。

com.alibaba.otter.canal.instance.core.AbstractCanalInstance#afterStartEventParser

  1. protected void afterStartEventParser(CanalEventParser eventParser) {
  2.         // 读取一下历史订阅的client信息       
  3.         List<ClientIdentity> clientIdentitys = metaManager.listAllSubscribeInfo(destination);
  4.         for (ClientIdentity clientIdentity : clientIdentitys) {
  5.             //更新filter
  6.             subscribeChange(clientIdentity);
  7.         }
  8.     }

subscribeChange 方法

     subscribeChange方法,主要是更新一下eventParser中的filter。

  1. @Override    
  2. public boolean subscribeChange(ClientIdentity identity) {
  3.         if (StringUtils.isNotEmpty(identity.getFilter())) {//如果设置了filter
  4.             logger.info("subscribe filter change to " + identity.getFilter());
  5.             AviaterRegexFilter aviaterFilter = new AviaterRegexFilter(identity.getFilter());
  6.             boolean isGroup = (eventParser instanceof GroupEventParser);
  7.             if (isGroup) {
  8.                 // 处理group的模式               
  9.                List<CanalEventParser> eventParsers = ((GroupEventParser) eventParser).getEventParsers();
  10.                 for (CanalEventParser singleEventParser : eventParsers) {// 需要遍历启动                   
  11.                          ((AbstractEventParser) singleEventParser).setEventFilter(aviaterFilter);
  12.                 }
  13.             } else {
  14.                 ((AbstractEventParser) eventParser).setEventFilter(aviaterFilter);
  15.             }
  16.         }
  17.         // filter的处理规则       
  18.        // a. parser处理数据过滤处理       
  19.        // b. sink处理数据的路由&分发,一份parse数据经过sink后可以分发为多份,每份的数据可以根据自己的过滤规则不同而有不同的数据      
  20.        // 后续内存版的一对多分发,可以考虑      
  21.      return true;
  22.     }

    关于filter,进行一下补充说明,filter规定了需要订阅哪些库,哪些表。在服务端和客户端都可以设置,客户端的配置会覆盖服务端的配置。

服务端配置:主要是配置instance.properties中的canal.instance.filter.regex配置项,官网文档关于这个配置项有以下介绍 

客户端配置

客户端在订阅时,调用CanalConnector接口中定义的带有filter参数的subscribe方法重载形式

  1. /**
  2. * 客户端订阅,重复订阅时会更新对应的filter信息
  3. *
  4. * <pre>
  5. * 说明:
  6. * a. 如果本次订阅中filter信息为空,则直接使用canal server服务端配置的filter信息
  7. * b. 如果本次订阅中filter信息不为空,目前会直接替换canal server服务端配置的filter信息,以本次提交的为准
  8. * </pre>
  9. */
  10. void subscribe(String filter) throws CanalClientException;

    至此,针对start eventParser前后的特殊处理步骤的两个方法:beforeStartEventParser和afterStartEventParser我们已经分析完成。

    对于stop eventParser前后做的特殊处理涉及的beforeStopEventParser和afterStopEventParser方法,这里不再赘述。

3.3 AbstractCanalInstance总结

    AbstractCanalInstance源码到目前我们已经分析完成,无非就是在start和stop时,按照一定的顺序启动或停止event store、event sink、event parser、meta manager这几个组件,期间对于event parser的启动和停止做了特殊处理,并没有提供订阅binlog的相关方法。那么如何来订阅binglog数据呢?答案是直接操作器内部组件。

    AbstractCanalInstance通过相关get方法直接返回了其内部的组件:

  1. @Override
  2. public CanalEventParser getEventParser() {return eventParser;}
  3. @Override
  4. public CanalEventSink getEventSink() {return eventSink;}
  5. @Override
  6. public CanalEventStore getEventStore() {return eventStore;}
  7. @Override
  8. public CanalMetaManager getMetaManager() {return metaManager;}

    在上一节server模块源码分析中,CanalServerWithEmbedded就是直接通过CanalInstance的内部组件,进行操作的。我们再次回顾一下getWithoutAck方法,进行验证:

 com.alibaba.otter.canal.server.embedded.CanalServerWithEmbedded#getWithoutAck

  1. public Message getWithoutAck(ClientIdentity clientIdentity, int batchSize, Long timeout, TimeUnit unit)
  2. throws CanalServerException 
  3. {
  4.     checkStart(clientIdentity.getDestination());
  5.     checkSubscribe(clientIdentity);
  6.     CanalInstance canalInstance = canalInstances.get(clientIdentity.getDestination());
  7.     synchronized (canalInstance) {
  8.         //通过canalInstance.getMetaManager() 获取到流式数据中的最后一批获取的位置
  9.         PositionRange<LogPosition> positionRanges = canalInstance.getMetaManager().getLastestBatch(clientIdentity);
  10.         Events<Event> events = null;
  11.         if (positionRanges != null) {
  12.             //通过canalInstance.getEventStore()获得binlog事件
  13.             events = getEvents(canalInstance.getEventStore(), positionRanges.getStart(), batchSize, timeout, unit);
  14.         } else {// ack后第一次获取,通过canalInstance.getMetaManager()获得开始位置
  15.             Position start = canalInstance.getMetaManager().getCursor(clientIdentity);
  16.             if (start == null) { // 第一次,还没有过ack记录,通过canalInstance.getEventStore()当前store中的第一条
  17.                 start = canalInstance.getEventStore().getFirstPosition();
  18.             }
  19.             //通过canalInstance.getEventStore()获得binlog事件
  20.             events = getEvents(canalInstance.getEventStore(), start, batchSize, timeout, unit);
  21.         }
  22.         if (CollectionUtils.isEmpty(events.getEvents())) {
  23.             logger.debug("getWithoutAck successfully, clientId:{} batchSize:{} but result is null", new Object[] {
  24.                     clientIdentity.getClientId(), batchSize });
  25.             return new Message(-1, new ArrayList<Entry>()); // 返回空包,避免生成batchId,浪费性能
  26.         } else {
  27.             // 通过canalInstance.getMetaManager()记录流式信息
  28.             Long batchId = canalInstance.getMetaManager().addBatch(clientIdentity, events.getPositionRange());
  29.             List<Entry> entrys = Lists.transform(events.getEvents(), new Function<Event, Entry>() {
  30.                 public Entry apply(Event input) {
  31.                     return input.getEntry();
  32.                 }
  33.             });
  34.            ...
  35.             return new Message(batchId, entrys);
  36.         }
  37.     }
  38. }

    可以看到AbstractCanalInstance除了负责启动和停止其内部组件,就没有其他工作了。真正获取binlog信息,以及相关元数据维护的逻辑,都是在CanalServerWithEmbedded中完成的。

    事实上,从设计的角度来说,笔者认为既然这些模块是CanalInstance的内部组件,那么相关操作也应该封装在CanalInstance的实现类中,对外部屏蔽,不应该把这些逻辑放到CanalServerWithEmbedded中实现。

    最后,AbstractCanalInstance中并没有metaManager、eventSink、eventPaser,eventStore这几个组件。这几个组件的实例化是在AbstractCanalInstance的子类中实现的。AbstractCanalInstance有2个子类:CanalInstanceWithSpring和CanalInstanceWithManager。我们将以CanalInstanceWithSpring为例进行说明如何给这几个组件赋值。

4 CanalInstanceWithSpring    

    CanalInstanceWithSpring是AbstractCanalInstance的子类,提供了一些set方法为instance的组成模块赋值,如下所示:

  1. public class CanalInstanceWithSpring extends AbstractCanalInstance {
  2.     private static final Logger logger = LoggerFactory.getLogger(CanalInstanceWithSpring.class);
  3.     public void start() {
  4.         logger.info("start CannalInstance for {}-{} ", new Object[] { 1, destination });
  5.         super.start();
  6.     }
  7.     // ======== setter ========
  8.     public void setDestination(String destination) {
  9.         this.destination = destination;
  10.     }
  11.     public void setEventParser(CanalEventParser eventParser) {
  12.         this.eventParser = eventParser;
  13.     }
  14.     public void setEventSink(CanalEventSink<List<CanalEntry.Entry>> eventSink) {
  15.         this.eventSink = eventSink;
  16.     }
  17.     public void setEventStore(CanalEventStore<Event> eventStore) {
  18.         this.eventStore = eventStore;
  19.     }
  20.     public void setMetaManager(CanalMetaManager metaManager) {
  21.         this.metaManager = metaManager;
  22.     }
  23.     public void setAlarmHandler(CanalAlarmHandler alarmHandler) {
  24.         this.alarmHandler = alarmHandler;
  25.     }
  26. }

    当我们配置加载方式为spring时,创建的CanalInstance实例类型都是CanalInstanceWithSpring。canal将会寻找本地的spring配置文件来创建instance实例。canal默认提供了一下几种spring配置文件:

  • spring/memory-instance.xml

  • spring/file-instance.xml

  • spring/default-instance.xml

  • spring/group-instance.xml

 在这4个配置文件中,我们无一例外的都可以看到以下bean配置:

  1. <!--注意class属性都是CanalInstanceWithSpring-->
  2. <bean id="instance" class="com.alibaba.otter.canal.instance.spring.CanalInstanceWithSpring">
  3.    <property name="destination" value="${canal.instance.destination}" />
  4.    <property name="eventParser">
  5.       <ref local="eventParser" />
  6.    </property>
  7.    <property name="eventSink">
  8.       <ref local="eventSink" />
  9.    </property>
  10.    <property name="eventStore">
  11.       <ref local="eventStore" />
  12.    </property>
  13.    <property name="metaManager">
  14.       <ref local="metaManager" />
  15.    </property>
  16.    <property name="alarmHandler">
  17.       <ref local="alarmHandler" />
  18.    </property>
  19. </bean>

    这四个配置文件创建的bean实例都是CanalInstanceWithSpring,但是工作方式却是不同的,因为在不同的配置文件中,eventParser、eventSink、eventStore、metaManager这几个属性引用的具体实现不同。

memory-instance.xml

所有的组件(parser , sink , store)都选择了内存版模式,记录位点的都选择了memory模式,重启后又会回到初始位点进行解析

特点:速度最快,依赖最少(不需要zookeeper)

场景:一般应用在quickstart,或者是出现问题后,进行数据分析的场景,不应该将其应用于生产环境

  1. <bean id="metaManager" class="com.alibaba.otter.canal.meta.MemoryMetaManager" />
  2. <bean id="eventStore" class="com.alibaba.otter.canal.store.memory.MemoryEventStoreWithBuffer">
  3.    ...
  4. </bean>
  5. <bean id="eventSink" class="com.alibaba.otter.canal.sink.entry.EntryEventSink">
  6.    <property name="eventStore" ref="eventStore" />
  7. </bean>
  8. <bean id="eventParser" class="com.alibaba.otter.canal.parse.inbound.mysql.MysqlEventParser”>
  9. ...
  10. </bean>

file-instance.xml

所有的组件(parser , sink , store)都选择了基于file持久化模式,注意,不支持HA机制.

特点:支持单机持久化

场景:生产环境,无HA需求,简单可用.

  1. <bean id="metaManager" class="com.alibaba.otter.canal.meta.FileMixedMetaManager">
  2.    <property name="dataDir" value="${canal.file.data.dir:../conf}" />
  3.    <property name="period" value="${canal.file.flush.period:1000}" />
  4. </bean>
  5. <bean id="eventStore" class="com.alibaba.otter.canal.store.memory.MemoryEventStoreWithBuffer">
  6.    ...
  7. </bean>
  8. <bean id="eventSink" class="com.alibaba.otter.canal.sink.entry.EntryEventSink">
  9.    <property name="eventStore" ref="eventStore" />
  10. </bean>
  11. <bean id="eventParser" class="com.alibaba.otter.canal.parse.inbound.mysql.MysqlEventParser”>
  12. ...
  13. </bean>

    在这里,有一点需要注意,目前开源版本的eventStore只有基于内存模式的实现,因此官方文档上说store也是基于file持久化的描述是错误的。

default-instance.xml:

所有的组件(parser , sink , store)都选择了持久化模式,目前持久化的方式主要是写入zookeeper,保证数据集群共享.

特点:支持HA

场景:生产环境,集群化部署.

  1. <!--注意,由于default-instance.xml支持同ZK来进行HA保障,所以多了此项配置-->
  2. <bean id="zkClientx" class="org.springframework.beans.factory.config.MethodInvokingFactoryBean" >
  3.    <property name="targetClass" value="com.alibaba.otter.canal.common.zookeeper.ZkClientx" />
  4.    <property name="targetMethod" value="getZkClient" />
  5.    <property name="arguments">
  6.       <list>
  7.          <value>${canal.zkServers:127.0.0.1:2181}</value>
  8.       </list>
  9.    </property>
  10. </bean>
  11. <bean id="metaManager" class="com.alibaba.otter.canal.meta.PeriodMixedMetaManager">
  12.    <property name="zooKeeperMetaManager">
  13.       <bean class="com.alibaba.otter.canal.meta.ZooKeeperMetaManager">
  14.          <property name="zkClientx" ref="zkClientx" />
  15.       </bean>
  16.    </property>
  17.    <property name="period" value="${canal.zookeeper.flush.period:1000}" />
  18. </bean>
  19. <bean id="eventStore" class="com.alibaba.otter.canal.store.memory.MemoryEventStoreWithBuffer">
  20.    ...
  21. </bean>
  22. <bean id="eventSink" class="com.alibaba.otter.canal.sink.entry.EntryEventSink">
  23.    <property name="eventStore" ref="eventStore" />
  24. </bean>
  25. <bean id="eventParser" class="com.alibaba.otter.canal.parse.inbound.mysql.MysqlEventParser”>
  26. ...
  27. </bean>

group-instance.xml:

主要针对需要进行多库合并时,可以将多个物理instance合并为一个逻辑instance,提供客户端访问。

场景:分库业务。 比如产品数据拆分了4个库,每个库会有一个instance,如果不用group,业务上要消费数据时,需要启动4个客户端,分别链接4个instance实例。使用group后,可以在canal server上合并为一个逻辑instance,只需要启动1个客户端,链接这个逻辑instance即可.

  1. <bean id="metaManager" class="com.alibaba.otter.canal.meta.MemoryMetaManager" />
  2. <bean id="eventStore" class="com.alibaba.otter.canal.store.memory.MemoryEventStoreWithBuffer">
  3.    ...
  4. </bean>
  5. <bean id="eventSink" class="com.alibaba.otter.canal.sink.entry.EntryEventSink">
  6.    <property name="eventStore" ref="eventStore" />
  7. </bean>
  8. <bean id="eventParser" class="com.alibaba.otter.canal.parse.inbound.group.GroupEventParser">
  9.    <property name="eventParsers">
  10.       <list>
  11.          <ref bean="eventParser1" />
  12.          <ref bean="eventParser2" />
  13.       </list>
  14.    </property>
  15. </bean>

    细心的读者会发现,这几个不同的spring配置文件中,最主要的就是metaManager 和eventParser 这两个配置有所不同,eventStore 、和eventSink 定义都是相同的。这是因为:

eventStore:目前的开源版本中eventStore只有一种基于内存的实现,所以配置都相同

eventSink:其作用是eventParser和eventStore的链接器,进行数据过滤,加工,分发的工作。不涉及存储,也就没有必要针对内存、file、或者zk进行区分。

    最后,上面只是列出了这几个模块spring配置文件不同定义,特别的针对metaManager和eventParser具体属性配置都没有介绍,我们将会在相应模块的源码分析中进行讲解。 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值