谈笑间学会数仓-技术架构设计

本文探讨了数据仓库的技术架构设计,包括离线、离线+实时和实时架构。离线架构涉及数据采集、存储、计算和调度的选型,如DataX、HDFS、Spark。离线+实时架构增加了实时处理组件,如Kafka、HBase。实时架构则关注实时引擎和存储,如Flink、Es。文章建议根据业务需求选择适当架构,实时数仓需考虑资源占用和数据存储策略。
摘要由CSDN通过智能技术生成

谈笑间学会数仓-技术架构设计

1、前言

  • 为何要谈数据仓库技术架构设计呢?

    技术架构设计是建设数仓的必备因素之一,分层架构为我们捋清了数据的架构及分层规范,并没有真正落地到具体的实施?

    有人说技术架构有什么好设计的?直接开整呗?

事实上并不是如此,成功始于计划,终于变化~

总而言之,言而总之,数仓设计是需要有技术方案来落地的。那么主要包含哪些呢?

离线、实时、离线+实时呗

2、离线技术架构

  • 首先我们来看一波架构图吧
    在这里插入图片描述

在这里插入图片描述

  • 小结
    • 离线技术架构无非包括以下几块内容的技术选型
      • 数据采集:datax、sqoop、flume
      • 数据存储:HDFS、Hive
      • 数据计算:MapReduce、sparksql、spark、hive、kylin、presto、impala
      • 任务调度:Oozie、crontab、azkaban

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

MrZhangBaby

请博主喝杯奶茶

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值