拆解大数据总线平台DBus的系统架构

宜信技术学院

于 2019-07-18 11:01:25 发布

阅读量973

点赞数 1

分类专栏：宜信开源技术文章标签：架构设计大数据流数据数据计算开源

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gao2175/article/details/96426349

版权

DBus是一个支持RDBMS和日志类数据源的大数据总线平台，采用日志抽取、增量转换和全量拉取模块处理数据。针对RDBMS，它利用Canal抽取MySQL增量日志，并通过Dispatcher和Appender进行数据转换和分发。日志类数据源通过规则算子进行结构化处理。系统采用UMS统一消息格式，提供心跳监控和预警确保数据流转健康。

摘要由CSDN通过智能技术生成

大体来说，Dbus支持两类数据源：

RDBMS数据源
日志类数据源

在这里插入图片描述

一、RMDBMS类数据源的实现

以mysql为例子. 分为三个部分：

日志抽取模块
增量转换模块
全量拉取模块

1.1 日志抽取模块（Extractor）

mysql 日志抽取模块由两部分构成：

canal server：负责从mysql中抽取增量日志。
mysql-extractor storm程序：负责将增量日志输出到kafka中，过滤不需要的表数据，保证at least one和高可用。

我们知道，虽然mysql innodb有自己的log，mysql主备同步是通过binlog来实现的。而binlog同步有三种模式：Row 模式，Statement 模式，Mixed模式。因为statement模式有各种限制，通常生产环境都使用row模式进行复制，使得读取全量日志成为可能。

通常我们的mysql布局是采用 2个master主库（vip）+ 1个slave从库 + 1个backup容灾库的解决方案，由于容灾库通常是用于异地容灾，实时性不高也不便于部署。

为了最小化对源端产生影响，我们读取binlog日志从slave从库读取。

读取binlog的方案比较多，DBus也是站在巨人的肩膀上，对于Mysql数据源使用阿里巴巴开源的Canal来读取增量日志。这样做的好处是：

不用重复开发避免重复造轮子
享受canal升级带来的好处

关于Canal的介绍可参考：https://github.com/alibaba/canal/wiki/Introduction 由于canal用户抽取权限比较高，一般canal server节点也可以由DBA组来维护。

日志抽取模块的主要目标是将数据从canal server中读出，尽快落地到第一级kafka中，避免数据丢失（毕竟长时间不读日志数据，可能日志会滚到很久以前，可能会被DBA删除），因此需要避免做过多的事情，主要就做一下数据拆包工作防止数据包过大。

从高可用角度考虑，在使用Canal抽取过程中，采用的基于zookeeper的Canal server高可用模式，不存在单点问题，日志抽取模块extractor也使用storm程序，同样也是高可用架构。

不同数据源有不同的日志抽取方式，比如oracle，mongo等都有相应的日志抽取程序。

DBus日志抽

最低0.47元/天解锁文章

宜信技术学院

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

宜信技术学院 CSDN认证博客专家

CSDN认证企业博客

203: 原创

4万+: 周排名

47万+: 总排名

25万+: 访问

: 等级

4463: 积分

197: 粉丝

76: 获赞

28: 评论

460: 收藏

私信

关注

热门文章

分类专栏

最新评论

宜信OCR技术探索之版面分析业务实践|技术沙龙直播速记
半岛铁盒.: 太秀了
Spring事务的传播行为案例分析
真正的飞鱼: 您好，我想问下，传播行为及对应含义的那个图片，出处是哪里，我没有找到
Q-learning算法实践
代码抄袭专业户: 说得很清楚非常有用比我研究生的老师说得清楚多了
宜信开源|Davinci：可视应用平台介绍与展望
黄发垂髫: 为什么注册新账户一直出错:Authentication failed; nested exception is javax.mail.AuthenticationFailedException: 502 Invalid input from 100.107.4.130 to newxmesmtplogicsvrsza8.qq.com 没有发现原因,邮箱的OP3/SMTP服务也开启了
FIX协议介绍
U97F3: FIX、Binary消息解析工具：https://gitee.com/CriticalHit/Trading-Message-Manager

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。