数据仓库 专栏

读者交流群已经开通了,有需要的可以私信或者V(DataSleuth)进入读者交流群,群内进行技术交流和资料共享

数据仓库已经是企业的数据竞争的核心了,学好数据仓库对提高自己和找到一份好的工作都至关重要,但是很多人对数仓的印象还是停留在写SQL的层面,其实今天的数仓更像是一个数据平台应用,我们学习的大数据技术其实最终的价值都体现在数据服务上,数仓是数据服务的基石,如果说业界以前还有离线和实时之分的话,那么现在实时数仓的提出与落地,未来数仓将是数据战争的最激烈的战场,一切大数据技术都将为数仓提供服务,也都将在数仓这一环节进行收口。

本专栏主要专注于数仓工具学习、数仓建模以及业务建模、SQL 实战和平台建设,最后以3家公司的数仓建建设和实时数仓作为结尾项目,这份教程有以下特点

  1. 知识体系完善,从数仓的概念、建模、数仓工具的使用、数仓的落地实践都有,还会有很多小案例,例如股票的连续涨停天数计算,最大涨停板的概率计算,会话分析,复杂时间序列匹配等

  2. 使用的技术都是当前企业最常用的技术,版本也是比较新的,不会导致大家看到一个代码,然后一执行发现语法不支持或者废弃掉了

  3. 后续的更新也会很及时,不会说更新了一段时间断更了,在更新完大纲之后,我也会不断完善该系列,不断添加新的知识点

  4. 创作团队都是在企业一线员工,实战多于理论,还有很多经典的面试题,例如拉链表的优化、计算连续登陆、连续增长、最大在线用户数

适合人群

  1. 小白对数仓感兴趣同学

  2. 有数仓经验但是缺乏全面认识的同学

  3. 引言

    1. 什么是数据仓库

    2. 数据仓库的作用和价值

    3. 数据仓库的发展历程

  4. 数据仓库基础

    1. 数据仓库的特征

    2. 数据仓库与操作数据库的区别

    3. 数据仓库的体系架构

  5. 数据建模

    1. 维度建模概述

    2. 事实表设计

    3. 维度表设计

    4. 星型模型与雪花模型

    5. 范式建模

    6. ER 模型

    7. vault建模

    8. 主数据管理

    9. 大数据建模

    10. 数据建模最佳实践和工具

  6. ETL过程

    1. 数据抽取

    2. 数据转换

    3. 数据加载

    4. ETL工具选择

    5. ETL开发实践

  7. 元数据管理

    1. 什么是元数据

    2. 元数据的作用

    3. 元数据设计

    4. 元数据管理工具

  8. 数据质量管理

    1. 数据质量概述

    2. 数据质量维度

    3. 数据质量监控

    4. 数据质量保证策略

  9. 数据仓库应用

    1. 商业智能与分析

    2. 行业应用案例分析

  10. 数据仓库运维

    1. 数据仓库监控

    2. 容量规划与优化

    3. 备份与恢复策略

  11. 新兴技术与趋势

    1. 大数据与数据湖

    2. 云数据仓库

    3. 实时数据集成

    4. 人工智能与机器学习应用

  12. 总结与展望

  • 3
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值