在数据仓库的实际工作中,80%的时间会花费在任务调度、数据清洗和业务梳理上,只有20%的时间会投入到数据挖掘上。
第一篇 数据大图和数据平台大图
第1章 数据大图
第2章 数据平台大图
1.OLTP、OLAP
2.建模方法论:Kimball与Inmon对比
Kimball维度建模的主题以星形架构为主,主题和主题之间则用一致性维和企业总线体系架构来保证数据仓库的集成和一致性。
如果是 Inmon 模式,我们需要将数据库拆分成 用户实体表、成交日志实体表、用户与成交日志关系表等多个子模块。
如果是 Kimball 模式,我们则需要将数据库拆分成 用户维度表、用户资产事实表、成交事实表。在Kimball模式中,我们不需要单独维护关系表,因为关系已经冗余在维度表和事实表中。