数据仓库 、数据中心相关技术知识和生态相关了解

本文介绍了数据仓库的分层目的、数据集市与数仓的区别,重点讲解了数据处理中的ETL工具Kettle,以及数据湖技术Hudi的特性。此外,还提及了数据中心的相关技术,如Camel框架和Canal的MySQL增量数据同步解决方案。
摘要由CSDN通过智能技术生成

数据仓库 、数据中心相关技术知识和生态相关了解


1、数据仓库 数仓

数仓的分层

1、ODS 层:Operation Data Store    原始数据层   加载原始数据不做处理
2、DWD 层:Data Warehouse Detail   明细数据层   对 ODS 层数据进行清洗,去除空值、脏数据、超过极限范围的数据,对敏感数据进行脱敏
3、DWS 层:Data Warehouse Service  服务数据层   以 DWD 数据为基础,按天进行轻度汇总
4、DWT 层:Data Warehouse Topic    数据主题层   以 DWT 数据为基础,按主题进行汇总
5、ADS 层:Application Data Store  数据应用层   为各种报表提供数据

分层的目的
1、简化复杂任务,方便定位问题
2、减少重复开发
3、隔离原始数据

数据集市(Data Market)和数据仓库
1、数据集市是数据仓库的 Mini 版本,主要服务于部门
2、数据仓库是企业级的,为企业的各个部门提供决策支持手段


一些数仓处理相关的技术框架
1、Azkaban 一套简单的任务调度服务

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

简简单单OnlineZuozuo

感谢哥哥姐姐的打赏

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值