读书笔记:《大数据之路:阿里巴巴大数据实践》

第1篇 数据技术篇

第2篇 数据模型篇

第9章 阿里巴巴数据整合及管理体系

9.1 概述

9.1.2 体系架构

在这里插入图片描述
业务板块:
规范定义:
模型设计:

9.2 规范定义

在这里插入图片描述

9.2.1 名词术语

在这里插入图片描述

9.2.2 指标体系
  1. 基本原则
    1. 组成体系之间的关系
    2. 命名约定
    3. 算法
      • 算法概述
      • 举例
      • SQL 算法说明
  2. 操作细则
    派生指标的种类:事务型指标、存量型指标、复合型指标
    复合型指标的规则:比率型

在这里插入图片描述
在这里插入图片描述

第10章 维度设计

10.3 维度变化

10.3.1 维度变化维

数据仓库的重要特点之一是反映历史变化,维度的属性并不是静态的,只是变化相对缓慢。
如何处理维度变化:

  1. 重写纬度值:不保留历史记录
  2. 插入新的维度行:保留历史记录
  3. 添加维度列:保留历史记录,并且更灵活
    在这里插入图片描述
    在这里插入图片描述

10.4 特殊维度

10.4.1 递归层次

在这里插入图片描述
在这里插入图片描述

  1. 层次结构扁平化
  2. 层次桥接表

第11章 实事表设计

11.1 实事表基础

11.1.1 实事表特性

实事表有三种类型:事务实事表、周期快照表、累计快照实事表

11.1.2 事实表设计原则

原则1:尽可能包含所有与业务过程相关的事实
原则2:只选择与业务过程相关的事实
原则3:分解不可加性事实为可加的组件
原则4:在选择维度和事实之前必须先声明粒度
原则5:在同一个事实表中不能有多重不同粒度的事实
原则6:事实的单位要保持一致
原则7:对事实的 null 值要处理
原则8:使用退化维度提高实事表的易用性

11.1.3 实事表设计方法
  • 第一步:选择业务过程及确定实事表类型
  • 第二步:声明粒度
  • 第三步:确定维度
  • 第四步:确定事实
  • 第五步:冗余维度

11.2 事务实事表

11.2.1 设计过程
  1. 选择业务过程
  2. 确定粒度
  3. 确定维度
  4. 确定事实
  5. 冗余维度
11.2.2 单事务事实表
11.2.3 多事务事实表
11.2.4 两种实事表对比

在这里插入图片描述

第3篇 数据管理篇

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值