【数据仓库-零】数据仓库知识体系 ing

本文详细介绍了数据仓库的基础概念,包括其定义、需求和架构;探讨了离线数仓的建设方法论,如分层方法和维度建模;涉及Hadoop在数据仓库中的应用以及ETL过程;提供数仓规范建设指南,包括命名规范和开发规范;最后讨论了数据可视化的工具和实践。通过这些内容,读者能全面理解数据仓库的构建与管理过程。
摘要由CSDN通过智能技术生成

通过熟悉构建数仓整体的过程,可以系统的了解

  • 数仓构建理论:能够站在全局角度看数仓的运行架构,数仓执行流程。
  • 了解到构建数仓的每一步对应使用哪些技术;

总之学习数仓为我们提供了构建、管理和优化大数据架构的关键技能和知识。

接下来我们了解下数据仓库都有哪些知识点需要我们进行学习:

一. 数仓基本概念

  • 数据仓库基础概念、建立数据仓库的由来
  • 数据仓库架构:
    1.数据集市、2.immon企业工厂架构、3. Kimball数据仓库架构、4.混合型数据架构
  • 数据仓库常见术语解析:维度模型和事实表
  • 数据仓库中ETL的概念
  • 数据仓库需求有哪些

【数仓基础(一)】基础概念:数据仓库【用于决策的数据集合】的概念、建立数据仓库的原因与好处

【数据仓库基础(二)】数据仓库架构

【数据仓库基础(三)】抽取-转换-装载

【数据仓库基础(四)】数据仓库需求:基本需求和数据需求

 

二. 离线数仓建设方法论

  1. 数仓分层方法
  2. 数仓建模方法:有如下三种方法:
    –(三)范式法
    – 维度建模法
    – 实体建模法
  3. 维度建模详解
  4. 数仓实施步骤

【数据仓库】数仓分层方法详解与层次调用规范

【数据仓库设计基础(一)】关系数据模型理论与数据仓库Inmon方法论

【数据仓库设计基础(二)】维度数据模型

【数据仓库设计基础(三)】数据集市

【数据仓库设计基础(四)】数据仓库实施步骤

维度建模和星型雪花模型的原则

 

三. hadoop与数据仓库的配合

  1. hadoop生态圈与数据仓库
  2. 了解数据抽取、转换和加载的概念
  3. ETL工具都有哪些:flink、hive等
  4. 如何进行数据的(ETL)清洗、转换和汇总

【数据仓库-9】hadoop生态圈与数据仓库

 

四. 数仓规范建设指南

  1. 数仓公共开发规范,见如下开发规范
    – 层次调用规范
    – 数据类型规范
    – 数据冗余规范
    – NULL字段处理规范
    – 指标口径规范
    – 数据表处理规范
    – 表的生命周期管理
  2. 数仓各层开发规范,见如下规范
    – ODS层设计规范
    – 公共维度层设计规范
    – DWD明细层设计规范
    – DWS公共汇总层设计规范
  3. 数仓命名规范:词根设计规范

【数据仓库】数仓分层方法详解与层次调用规范
 

五. 数据可视化

常见的数据可视化工具
如何设计仪表板和报表

 

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

roman_日积跬步-终至千里

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值