【Hive】——数据仓库

12 篇文章 0 订阅

1.1 数仓概念

数据仓库(data warehouse):是一个用于存储,分析,报告的数据系统
目的:是构建面向分析的集成化数据环境,分析结果为企业提供决策支持
特点:
数据仓库本身不产生任何数据,其数据来源于不同外部系统
数据仓库也不需要消费任何的书,其结果开放给各个外部应用使用
这也是为什么叫仓库,而不叫工厂的原因
在这里插入图片描述

1.2 案例

在这里插入图片描述

1.3 数仓特征

在这里插入图片描述

1.3.1 面向主题性

在这里插入图片描述

1.3.2 集成性

在这里插入图片描述

1.3.3 非易性、非异变性

在这里插入图片描述

1.3.4 时变性

在这里插入图片描述

1.4 OLTP、OLAP

1.4.1 OLTP:联机事务处理

在这里插入图片描述

1.4.2 OLAP:联机分析处理

在这里插入图片描述
在这里插入图片描述

1.4.3 OLAP对比OLTP

在这里插入图片描述

在这里插入图片描述

1.5 数据仓库、数据库的区别

在这里插入图片描述
在这里插入图片描述

1.6 数据仓库、数据集市的区别

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1.7 数据仓库思想与架构

1.7.1 分层思想和标准

操作型数据层(ODS)
数据仓库层(DW)
数据应用层(DA)
在这里插入图片描述

1.7.2 ODS层(Operation Data Store)

在这里插入图片描述

1.7.2 DW层(Data Warehouse)

在这里插入图片描述

1.7.3 DA层(或ADS层)

在这里插入图片描述

1.8 分层作用

在这里插入图片描述
在这里插入图片描述

1.9 ETL、ELT

ETL:抽取Extra、转化Transfer、装载Load
具体顺序基于业务实际灵活选择

1.9.1 ETL

在这里插入图片描述
在这里插入图片描述

1.9.2 ELT

在这里插入图片描述

在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值