数仓建模—美团DB数据同步到数据仓库的架构与实践

数仓建模—美团DB数据同步到数据仓库的架构与实践

前面我们介绍了数据同步方案的设计,你可以参考数仓建模—数据同步方案设计,前面我们也说了,我们基于binlog 实现的数据同步方案,基本是都是基于下面架构的改造实现

image-20211221175058693这里我们就看一下美团的一个实现,本文主要从Binlog实时采集和离线处理Binlog还原业务数据两个方面,来介绍如何实现DB数据准确、高效地进入数仓。

整体架构

img

整体的架构如上图所示。在Binlog实时采集方面,我们采用了阿里巴巴的开源项目Canal,负责从MySQL实时拉取Binlog并完成适当解析。Binlog采集后会暂存到Kafka上供下游消费。整体实时采集部分如图中红色箭头所示。

离线处理Binlog的部分,如图中黑色箭头所示,通过下面的步骤在Hive上还原一张MySQL表:

  1. 采用Linkedin的开源项目Camus,负责每小时把Kafka上的Binlog数据拉取到Hive上。
  2. 对每张ODS表,首先需要一次性制作快照(Snapshot),把MySQL里的存量数据读取到Hive上,这一过程
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 云原生数据中台架构、方法论与实践是一本关于数据中台的书籍。数据中台是一种集成不同业务系统和数据源的平台,以满足用户需求并提高企业决策的能力。云原生数据中台则是以云原生技术为基础,使用微服务架构和容器化技术,实现高可用、高性能、高扩展性的数据中台。 本书分为三部分:架构原理、方法论和实践案例。架构原理部分介绍了云原生数据中台的建设思路和设计原则,包括微服务架构、DevOps、容器化等内容。方法论部分重点阐述数据中台建设中的核心概念和流程,如数据建模、数据采集、数据处理和数据服务等。实践案例部分则以企业实际案例为例,深入说明数据中台在实际场景中的应用和经验。 本书的特点在于将云原生技术和数据中台建设结合起来,提出了一种全新的数据中台建设思路和方法论。通过本书的学习,读者可以深入了解云原生技术和数据中台构建的最佳实践,以及如何将其应用于企业实践中,提高企业数据决策能力和竞争力。 总体来说,云原生数据中台架构、方法论与实践是一本非常实用的指南,适用于希望深入了解数据中台建设和云原生技术的从业人员,以及希望在企业实践中应用数据中台的决策者和管理人员。 ### 回答2: “云原生数据中台架构、方法论与实践”是一篇对云原生架构下的数据中台建设进行阐述和实践的论文。首先,文章介绍了传统数据中台的局限性,包括数据孤岛、数据质量差等问题。接着,作者提出了云原生数据中台架构的概念,强调了其具有智能、弹性、灵活性等特点。云原生数据中台的基本架构包括数据采集、数据存储、数据计算和数据服务等四个层级,详细介绍了各层级应用的技术和工具。在方法论方面,作者提出了“全时节奏、全参与、全数据价值驱动”三个关键点,强调了数据中台建设需要全员参与和全生命周期的考虑。最后,论文以某电商平台的实践案例为例,详细介绍了云原生数据中台在实践中的应用和效果。总的来说,“云原生数据中台架构、方法论与实践”为我们提供了一种全新的数据中台建设思路和方法,可以为企业提高数据价值和效率提供有力的支持。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值