通过实践一、二、三之后,我们已经能初步的运用otter来实现某个仓库的数据同步需求,那么多个仓库都要往一张表里同步怎么办呢?
otter的pipeline配置,是一个pipeline仅仅只能连接一个源,如果需要多源的情况下,仅仅只需要把之前的配置再配置一遍,然后转义代码里重设warehouse_id的值用于区分数据的来源即可
一、配新的数据源、需要同步的数据表、新的canal
二、配置一个新的cannal、pipeline
三、把之前的配置的映射关系再配置一次
需要注意的是,我们是多个仓库的数据同步到云,所以我们要重新定义仓库id来确保数据的来源(自定义转义代码里)
四、启动
因为步骤比较简单,本文不在一一再次截图,附图为最终结果