![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据仓库
文章平均质量分 83
数仓
健鑫.
大厂数据开发,专注于分享学习经验以及大数据领域相关知识,欢迎关注~
展开
-
数据仓库简介
首先,各个部门的分析结果就会不一致,因为如果两个部门是在不同的时间抽取的同一个业务数据库的数据进行分析,结果肯定会不一致。其次,每个部门都要建立数据抽取系统,就会产生资源的浪费,每个数据抽取系统都要数据库的权限,数据库的权限管理也会变得麻烦。同时还会降低数据库的性能。一般最长调用的都是最近的数据,过早的数据调用的频率就很低。同时在数据量没到达一定的规模的时候,数据仓库处理数据的速度还是比较慢的,因为要对任务进行拆分、调度、合并,如果数据量很少的话,这个过程所要花费的时间比处理数据所花费的时间都要多。原创 2023-03-23 20:29:05 · 659 阅读 · 16 评论 -
数仓理论【范式】【维度建模】
维度模型分为三种:星型模型、雪花模型、星座模型星型模型标准的星型模型只有一层雪花模型雪花模型和星型模型的区别主要在于维度的层级雪花模型较为靠近3NF,但是无法完全遵守星座模型星座模型包含多个事实表,多个事实表共享维度表多个星型模型或者雪花模型会形成星座模型。原创 2023-02-16 11:04:49 · 983 阅读 · 0 评论 -
Superset的安装(亲测三遍,有效)
Apache Superset是一个开源的、现代的、轻量级BI分析工具,能够对接多种数据源、拥有丰富的图表展示形式、支持自定义仪表盘,且拥有友好的用户界面,十分易用。在学习数仓项目的时候,按照教程安装Superset反复重复多次都没能成狗,最后稍微修改之后得以成功安装,现记录下安装过程。原创 2022-10-19 13:23:56 · 2312 阅读 · 1 评论 -
数据仓库和数据集市
Data warehouse数据仓库,是在数据库大量存在的情况下,一整套包括etl、调度、建模在内的完整理论体系。建设目的:支持复杂的分析操作,侧重决策支持,提供直观的查询结果。数据仓库不是数据的目的地,而是为数据的目的地做准备,包含:清洗,转义,分类,重组,统计,拆分等原创 2022-11-28 15:32:56 · 1647 阅读 · 0 评论