实时数仓架构设计

整体架构图

 

数据订阅同步(ODS)

实时流订阅

前期同步 binlog,埋点数据

离线数仓同步

根据实时数仓业务需要,同步相应离线数仓维表

 

实时数仓(DW)

数据明细层(DWD)

订阅来自 ODS 层的流数据,过滤无效数据,测试数据等,保留明细数据流

数据分流层

根据订阅流中不同 topic,分流不同数据,如总日志埋点数据中,经过分流层后,可分流出不同业务的日志数据(订餐埋点,广告埋点等),分流的 topic 可以通过维护元数据表来进行 Join

数据汇总层(DWS)

根据不同业务对流式数据进行汇总,主题 + 时间 + 原子指标三个维度组合进行统计,通过 JOIN 离线业务表来进行数据维度的扩展

质量监控(DQC)

结合离线数仓和实时流特性,可以从「业务延迟」,「任务出错」,「数据波动」,「数据质量」四方面对实时数仓做质量监控

业务应用(App)

针对不同业务,可订阅「数据明细层」,「数据分流层」,「数据汇总层」的流式数据进行实时业务场景的应用

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值