读者交流群已经开通了,有需要的可以私信或者V(DataSleuth)进入读者交流群,群内进行技术交流和资料共享
数据仓库已经是企业的数据竞争的核心了,学好数据仓库对提高自己和找到一份好的工作都至关重要,但是很多人对数仓的印象还是停留在写SQL的层面,其实今天的数仓更像是一个数据平台应用,我们学习的大数据技术其实最终的价值都体现在数据服务上,数仓是数据服务的基石,如果说业界以前还有离线和实时之分的话,那么现在实时数仓的提出与落地,未来数仓将是数据战争的最激烈的战场,一切大数据技术都将为数仓提供服务,也都将在数仓这一环节进行收口。
本专栏主要专注于数仓工具学习、数仓建模以及业务建模、SQL 实战和平台建设,最后以3家公司的数仓建建设和实时数仓作为结尾项目,这份教程有以下特点
-
知识体系完善,从数仓的概念、建模、数仓工具的使用、数仓的落地实践都有,还会有很多小案例,例如股票的连续涨停天数计算,最大涨停板的概率计算,会话分析,复杂时间序列匹配等
-
使用的技术都是当前企业最常用的技术,版本也是比较新的,不会导致大家看到一个代码,然后一执行发现语法不支持或者废弃掉了
-
后续的更新也会很及时,不会说更新了一段时间断更了,在更新完大纲之后,我也会不断完善该系列,不断添加新的知识点
-
创作团队都是在企业一线员工,实战多于理论,还有很多经典的面试题,例如拉链表的优化、计算连续登陆、连续增长、最大在线用户数
适合人群
-
小白对数仓感兴趣同学
-
有数仓经验但是缺乏全面认识的同学
-
引言
-
什么是数据仓库
-
数据仓库的作用和价值
-
数据仓库的发展历程
-
-
数据仓库基础
-
数据仓库的特征
-
数据仓库与操作数据库的区别
-
数据仓库的体系架构
-
-
数据建模
-
维度建模概述
-
事实表设计
-
维度表设计
-
星型模型与雪花模型
-
范式建模
-
ER 模型
-
vault建模
-
主数据管理
-
大数据建模
-
数据建模最佳实践和工具
-
-
ETL过程
-
数据抽取
-
数据转换
-
数据加载
-
ETL工具选择
-
ETL开发实践
-
-
元数据管理
-
什么是元数据
-
元数据的作用
-
元数据设计
-
元数据管理工具
-
-
数据质量管理
-
数据质量概述
-
数据质量维度
-
数据质量监控
-
数据质量保证策略
-
-
数据仓库应用
-
商业智能与分析
-
行业应用案例分析
-
-
数据仓库运维
-
数据仓库监控
-
容量规划与优化
-
备份与恢复策略
-
-
新兴技术与趋势
-
大数据与数据湖
-
云数据仓库
-
实时数据集成
-
人工智能与机器学习应用
-
-
总结与展望