CC00006.bdpositions——|Hadoop&实时数仓.V06|——|项目.v06|Canal同步业务数据|环境准备|初始Canal|

yanqi_vip

已于 2022-04-16 16:54:20 修改

阅读量418

点赞数

分类专栏： bigdatav026——EB实时数仓文章标签：数据库 mysql java python linux

于 2022-04-15 14:44:00 首次发布

不予转载

本文链接：https://blog.csdn.net/yanqi_vip/article/details/124207658

版权

一、Canal同步业务数据

### --- 环境准备

~~~     Hadoop、HBASE、Flink、ClickHouse、MySQL、Canal、Kafka

### --- 初始Canal：什么是 Canal

~~~     阿里巴巴B2B公司，因为业务的特性，卖家主要集中在国内，买家主要集中在国外，
~~~     所以衍生出了杭州和美国异地机房的需求，
~~~     从2010年开始，阿里系公司开始逐步的尝试基于数据库的日志解析，
~~~     获取增量变更进行同步，由此衍生出了增量订阅&消费的业务。
~~~     Canal是用java开发的基于数据库增量日志解析，提供增量数据订阅&消费的中间件。
~~~     目前，Canal主要支持了MySQL的binlog解析，
~~~     解析完成后才利用Canal client 用来处理获得的相关数据。
~~~     (数据库同步需要阿里的otter中间件，基于Canal)。

二、使用场景：

原始场景:阿里otter中间件的一部分otter是阿里用于进行异地数据库之间的同步框架Canal是其中一部分。

常见场景1：更新缓存

场景2：抓取业务数据新增变化表，用于制作拉链表：订单表,6月20号有3条记录：

订单创建日期	订单编号	订单状态
2012-06-20	001	创建订单
2012-06-20	002	创建订单
2012-06-20	003	支付完成

到6月21日，表中有5条记录：

最低0.47元/天解锁文章

yanqi_vip

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
CC00006.bdpositions——|Hadoop&实时数仓.V06|——|项目.v06|Canal同步业务数据|环境准备|初始Canal|

一、Canal同步业务数据### --- 环境准备~~~ Hadoop、HBASE、Flink、ClickHouse、MySQL、Canal、Kafka### --- 初始Canal：什么是 Canal~~~ 阿里巴巴B2B公司，因为业务的特性，卖家主要集中在国内，买家主要集中在国外，~~~ 所以衍生出了杭州和美国异地机房的需求，~~~ ...
复制链接

扫一扫