数据仓库
文章平均质量分 81
哥本哈士奇
专注BI, 大模型。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
数据仓库笔记 第六篇:PSA 层 SCD2 处理方式
**SCD2(Slowly Changing Dimension Type 2)** 是维度建模中处理历史变更的行业标准且最常用的方案。相比快照方式,SCD2只写入真正发生变化的数据行,通过 `有效期` 字段精确记录每条数据的生命周期,用极低的存储成本实现完整的历史追溯能力。这一篇用详细的代码解释其工作流程。此笔记使用的数据库为SQLServer,相应的示例脚本都围绕于此,其它数据库的相应实现会略有不同。原创 2026-04-28 00:22:36 · 821 阅读 · 0 评论 -
数据仓库笔记 第五篇:Data Mart 层(数据集市)
什么是 Data Mart?Data Mart(数据集市)是数据仓库的**面向主题的子集**,专门为特定业务部门或分析场景服务。我个人建议,前端BI工具,无论是Power BI或者是Tableau,都从这一层取数据,这样一来可以提高前端报表性能,同时也可以降低前端工具的建模难度。此笔记使用的数据库为SQLServer,相应的示例脚本都围绕于此,其它数据库的相应实现会略有不同。原创 2026-04-27 00:08:19 · 92 阅读 · 0 评论 -
数据仓库笔记 第四篇:Star Schema 层(维度建模)
Star Schema(星型模型)是 **Ralph Kimball** 提出的维度建模方法,是数据仓库**面向分析的核心层**。此笔记使用的数据库为SQLServer,相应的示例脚本都围绕于此,其它数据库的相应实现会略有不同。原创 2026-04-27 00:07:31 · 388 阅读 · 0 评论 -
数据仓库笔记 第三篇:常用缓慢变化维处理方式介绍
数据仓库可以帮助我们追溯数据的历史变化,其中最主要的一个方法就是缓慢变化维。此篇主要介绍最常用的缓慢变化维:Type1, Type2, Type3。此笔记使用的数据库为SQLServer,相应的示例脚本都围绕于此,其它数据库的相应实现会略有不同。原创 2026-04-27 00:06:49 · 273 阅读 · 0 评论 -
数据仓库笔记 第二篇:PSA 层(持久化暂存区)详解
PSA(Persistent Staging Area,持久化暂存区)是数据仓库的**第一层持久化存储**,直接接收从业务系统抽取的数据,并**长期保存所有历史版本**。作为数据库的第一层,叫法很多,也有叫stage,也有叫OBS,标准不是非常的统一。在我的系列笔记里都统一使用psa的这个叫法。此笔记使用的数据库为SQLServer,相应的示例脚本都围绕于此,其它数据库的相应实现会略有不同。原创 2026-04-27 00:06:08 · 228 阅读 · 0 评论 -
数据仓库笔记 第一篇:数据仓库的定义、历史与意义
数据仓库(Data Warehouse,简称 DW 或 DWH)是一个**面向主题的、集成的、非易失的、随时间变化的**数据集合,用于支持管理决策。此笔记使用的数据库为SQLServer,相应的示例脚本都围绕于此,其它数据库的相应实现会略有不同。原创 2026-04-27 00:05:21 · 406 阅读 · 0 评论
分享