数据仓库之路:为你推荐六本经典的数据仓库书籍

这是傅一平的第325篇原创

作者:傅一平

个人微信:fuyipingmnb

“与数据同行”开通了微信群,已经汇聚了4000位小伙伴了,加我为微信好友(微信号:frank61822702)申请即可,我会拉你入群。

导读:2004年笔者进入公司后就从事数据仓库的工作,伴随着中国移动经营分析系统的发展而成长,主导过多次数据仓库的重构建设,见证了数据仓库从ORACLE到DB2、从DB2到ASTER、从ASTER到一体机、从一体机到GBASE、从GBASE拓展到Hadoop、再从Hadoop演进到实时数据仓库的历程。

开了“与数据同行”的微信群(入群方式:加微信frank61822702)后,很多人会问到关于数据仓库的问题,这里笔者推荐六本比较经典的数据仓库书籍,既有数据仓库之父Inmon的关系模型,也有另一位大师Ralph Kimball的维度建模,还有阿里的维度建模实践等等。

但数据仓库是一门实践的学问,你只有深入的参与到一个数据仓库项目中,才能深刻领会到其中的奥妙。

注:个别书籍如要先睹为快可以加微信frank61822702获取相关电子版的信息,但仅作为购买正版纸质书的参考,不要用于商业用途

1

数据仓库工具箱(第3版)——维度建模权威指南

作者:Ralph Kimball 

推荐告诉你维度建模的表该如何设计,有坑了怎么解决,有电子版。

2

数据仓库生命周期工具箱

作者:金博尔

推荐告诉你数据仓库从0到1都有什么流程,更多的是管理流程,每个阶段有什么样的文档。

3

数据仓库ETL工具箱

作者:金博尔

推荐语:告诉你模型建好了,ETL到底如何实施,ETL到底怎么设计,才能把数据仓库建好。

4

数据仓库设计

作者:依默霍夫

推荐全面论述了设计和建立高效、可持续发展且可扩展的数据仓库的方法,重点论述了建立各种数据模型的方法。

5

数据仓库

作者:Inmon

推荐系统讲述数据仓库的基本概念、基本原理以及建立数据仓库的方法和过程,有电子版。

6

大数据之路

作者:阿里巴巴数据技术及产品部

推荐语:阿里巴巴大数据实践之书,很大篇幅阐述了维度建模的具体做法,有电子版。

看到这里的你,一定是爱读书爱数据的人。欢迎加入与数据同行微信群,结识更多数据、产品等行业小伙伴,笔者也会定时分享好书和好文。让我们共同提升

猜你想看我的更多文章????

业务为王,这两年我们采用的那些数据产品和技术引擎

大数据架构如何做到流批一体?

美团点评基于 Flink 的实时数仓平台实践

“做好大数据测试,我是认真的!”

 辨析BI、数据仓库、数据湖和数据中台内涵及差异点(建议收藏)

一文读懂非关系型数据库(NoSQL)

如何深入浅出的理解数据仓库建模?

拥有敏捷数据交付平台(DataMaster)是怎样一种体验?

痛苦与变革,如何避免大数据PaaS平台建设中的这些“坑”?

中国电信的“天翼大数据飞龙平台”长啥样?

如何打造敏捷的数据挖掘能力?

论道数据仓库维度建模和关系建模

解读云栖大会的《阿里巴巴数据服务产品开发及大数据体系》

阿里云机器学习平台的思考

一个传统企业大数据发展的编年史

一个业务化的大数据PaaS平台启示录

为什么选择这样的大数据平台架构?

我们需要什么样的ETL?

重新认识数据可视化

一只传统企业大数据平台团队的绽放!

看上去很美, 谈谈阿里云的大数据平台「数加」

浙江移动大数据平台践行之路(上)

浙江移动大数据平台践行之路(下)

要看更多,请点击左下角阅读原文即可阅读整理好的所有文章!

评论 1 您还未登录,请先 登录 后发表或查看评论
学习数据仓库好书,很经典。 目录 目录 译者序 审、译者简介 前言 第1章 决策支持系统发展 1 1.1 演化 1 1.2 直接存取存储设备产生 2 1.3 个人计算机/第四代编程语言技术 3 1.4 进入抽取程序 3 1.5 蜘蛛网 4 1.6 自然演化体系结构问题 5 1.6.1 数据缺乏可信性 5 1.6.2 生产率问题 8 1.6.3 从数据到信息 10 1.6.4 方法变迁 11 1.7 体系结构设计环境 12 1.7.1 体系结构设计环境层次 13 1.7.2 集成 14 1.8 用户是谁 15 1.9 开发生命周期 15 1.10 硬件利用模式 16 1.11 建立重建工程舞台 16 1.12 监控数据仓库环境 17 1.13 小结 19 第2章 数据仓库环境 20 2.1 数据仓库结构 22 2.2 面向主题 23 2.3 第1天到第n天现象 26 2.4 粒度 28 2.4.1 粒度一个例子 29 2.4.2 粒度双重级别 31 2.5 分割问题 34 2.6 样数据库 34 2.7 数据分割 35 2.8 数据仓库数据组织 37 2.9 数据仓库—标准手册 41 2.10 审计和数据仓库 41 2.11 成合理性 41 2.12 清理仓库数据 42 2.13 报表和体系结构设计环境 42 2.14 机遇性操作型窗口 43 2.15 小结 44 第3章 设计数据仓库 45 3.1 从操作型数据开始 45 3.2 数据/过程模型和体系结构设计环境 49 3.3 数据仓库和数据模型 50 3.3.1 数据模型 52 3.3.2 中间层数据模型 54 3.3.3 物理数据模型 58 3.4 数据模型和反复开发 59 3.5 规范化/反规范化 60 3.6 数据仓库快照 65 3.7 元数据 66 3.8 数据仓库管理参照表 66 3.9 数据周期 67 3.10 转换和集成复杂性 70 3.11 触发数据仓库记录 71 3.11.1 事件 72 3.11.2 快照构成 72 3.11.3 一些例子 72 3.12 简要记录 73 3.13 管理大量数据 74 3.14 创建多个简要记录 75 3.15 从数据仓库环境到操作型环境 75 3.16 正常处理 75 3.17 数据仓库数据直接访问 76 3.18 数据仓库数据间接访问 76 3.18.1 航空公司佣金计算系统 76 3.18.2 零售个性化系统 78 3.18.3 信用审核 80 3.19 数据仓库数据间接利用 82 3.20 星型连接 83 3.21 小结 86 第4章 数据仓库粒度 87 4.1 粗略估算 87 4.2 粒度划分过程输入 88 4.3 双重或单一粒度? 88 4.4 确定粒度级别 89 4.5 一些反馈循环技巧 90 4.6 粒度级别—以银行环境例 90 4.7 小结 95 第5章 数据仓库和技术 96 5.1 管理大量数据 96 5.2 管理多介质 97 5.3 索引/监视数据 97 5.4 多种技术接口 97 5.5 程序员/设计者对数据存放位置控制 98 5.6 数据并行存储/管理 99 5.7 元数据管理 99 5.8 语言接口 99 5.9 数据高效装入 99 5.10 高效索引利用 100 5.11 数据压缩 101 5.12 复合键码 101 5.13 变长数据 101 5.14 加锁管理 102 5.15 单独索引处理 102 5.16 快速恢复 102 5.17 其他技术特征 102 5.18 DBMS类型和数据仓库 102 5.19 改变DBMS技术 104 5.20 多维DBMS和数据仓库 104 5.21 双重粒度级 109 5.22 数据仓库环境中元数据 109 5.23 上下文和内容 111 5.24 上下文信息三种类型 111 5.25 捕获和管理上下文信息 113 5.26 刷新数据仓库 113 5.27 小结 114 第6章 分布式数据仓库 116 6.1 引言 116 6.2 局部数据仓库 118 6.3 全局数据仓库 119 6.4 互斥数据 121 6.5 冗余 123 6.6 全局数据存取 124 6.7 分布式环境下其他考虑因素 126 6.8 管理多个开发项目 127 6.9 开发项目性质 127 6.10 分布式数据仓库 130 6.10.1 在分布地理位置间协调开发 131 6.10.2 企业数据分布式模型 132 6.10.3 分布式数据仓库元数据 134 6.11 在多种层次上建造数据仓库 134 6.12 多个小组建立当前细节级 136 6.12.1 不同层不同需求 138 6.12.2 其他类型细节数据 140 6.12.3 元数据 142 6.13 公用细节数据采用多种平台 142 6.14 小结 143 第7章 高级管理人员信息系统 和数据仓库 144 7.1 一个简单例子 144 7.2 向下探察分析 146 7.3 支持向下探察处理 147 7.4 作EIS基础数据仓库 149 7.5 到哪里取数据 149 7.6 事件映射 152 7.7 细节数据和EIS 153 7.8 在EIS中只保存汇总数据 154 7.9 小结 154 第8章 外部数据/非结构化数据与 数据仓库 155 8.1 数据仓库外部数据/非结构化数据 157 8.2 元数据和外部数据 158 8.3 存储外部数据/非结构化数据 159 8.4 外部数据/非结构化数据不同 组成部分 160 8.5 建模与外部数据/非结构化数据 160 8.6 间接报告 161 8.7 外部数据归档 161 8.8 内部数据与外部数据比较 161 8.9 小结 162 第9章 迁移到体系结构设计环境 163 9.1 一种迁移方案 163 9.2 反馈循环 167 9.3 策略方面考虑 168 9.4 方法和迁移 171 9.5 一种数据驱动开发方法 171 9.6 数据驱动方法 172 9.7 系统开发生命周期 172 9.8 一个哲学上考虑 172 9.9 操作型开发/DSS开发 173 9.10 小结 173 第10章 数据仓库设计复查要目 174 10.1 进行设计复查所涉及问题 175 10.1.1 谁负责设计复查 175 10.1.2 有哪些议事日程 175 10.1.3 结果 175 10.1.4 复查管理 175 10.1.5 典型数据仓库设计复查 176 10.2 小结 185 附录 186 技术词汇 215 参考文献 222

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
©️2022 CSDN 皮肤主题:大白 设计师:CSDN官方博客 返回首页

打赏作者

傅一平

你的鼓励将是我创作的最大动力

¥2 ¥4 ¥6 ¥10 ¥20
输入1-500的整数
余额支付 (余额:-- )
扫码支付
扫码支付:¥2
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值