Oracle 数据仓库详解

1 概述

数据库 VS 数据仓库

  • 数据库是面向事务设计的,属于 OLTP(在线事务处理)系统,主要操作是随机读写;在设计时尽量避免冗余,常采用范式规范来设计
  • 数据仓库是面向主题设计的,属于 OLAP(在线分析处理)系统,主要操作是批量读写;在设计时会允许适当冗余,注重数据整合,以及分析、处理性能
数据库数据仓库
面向事务分析
目的日常操作长期信息需求、决策支持
操作读、写大多数为读
设计模型基于 ER 模型,面向应用星型、雪花型,面向主题
数据类型细节、业务综合、清洗过的数据
数据特点当前的、最新的历史的、跨时间维护
数据规模GB 到 TB>= TB

2 数据仓库

2.1 数仓分层

数据仓库的分层没有绝对统一的标准,请按实际业务需求进行增减
但有以下几个核心层,由上至下 依次为

分层子分层描述场景
ADS-数据应用层:Application Data Service报表查询
DWDWS数据服务层:Data Warehouse Service汇总数据,用于分析
DWM数据中间层:Data WareHouse Middle在 DWD 基础上进行轻微聚合操作,算出相应指标,形成 中间表
DWD数据明细层:Data Warehouse Details对 ODS 数据进行 ETL 后的明细数据
维度退化,形成 宽表,减少 join,优化查询
ODS-原始数据层:Operational Data Store同步原始业务数据,表结构保持不变

DW: 中还可以有 DIM(维度层)和 TEMP(临时层)等
ETL:Extract(抽取)、Transform(转换)、Load(加载)
常用的 ETL 工具:Spoon Kettle
APS:又称 DM(Data Mart 数据集市)、DWM:又称 DWB(基础数据层)

2.2 维度建模

维度建模的实现有两种:星型模型雪花模型,主要区别在于对 维度表 的拆分
星型模型:一般采用 降维 的操作,利用冗余来避免模型过于复杂,提高易用性和分析效率
雪花模型:维度表的设计更加规范,一般符合 3NF
推荐:更倾向于 星型模型,尤其是 hadoop 体系

星型模型:像五角星一样
在这里插入图片描述

雪花模型:像雪花一样
在这里插入图片描述

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

鱼丸丶粗面

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值