实时数仓学习笔记沉淀-需求及架构选型

本文探讨了在熟悉Linux和Hadoop/Flink技术背景下,如何使用腾讯云EMR进行一站式大数据处理,涉及需求分析、架构设计、数据采集、存储、计算、查询和可视化的全过程,以及技术选型策略如Kafka、HBase、ClickHouse等的应用。
摘要由CSDN通过智能技术生成

熟悉Linux 对Hadoop大数据体系有了解 对Flink大数据体系有一定了解

腾讯云EMR:优点 高效(一站式部署) 便捷(没有繁琐的配置文件,由腾讯云部署)灵活(可以选择腾讯云提供的服务,也可以自行安装搭建服务)

hadoop flink实时运算  kafka 分层 hbase(基于hdfs磁盘存储)  phoenix皮肤 可以在hbase上写sql来存储维表  redis内存数据库,加速维表查询 clickhouse放置dws层数据供查询

学习过程:

了解项目需求,结合需求完成架构设计

了解电商数据结构

选购EMR

电商业务数据选择

数据采集

目标:

根据数仓建模理论搭建完整数据仓库,包括:需求分析、架构设计、数据存储、建模、计算、输出、展示等流程

学习腾讯云EMR各服务组件的具体使用以及组件之间的配置联动

项目需求:

1业务数据传输通道搭建

2数据仓库维度建模

事实数据和维度数据

3任务调度

4数据可视化

项目技术如何选型 框架版本如何选型 服务器使用物理机还是云主机 如何确认集群规模

数据采集传输:kafka ODS层 flink-cdc(增量同步)

数据存储:业务数据Mysql 大数据HDFS HBase(列式存储,查询快)

数据计算:Flink

数据查询:ClickHouse 列存 单表查询效率高

数据可视化 Sugar

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值