数据仓库(期末试题)
今天你用钱袋里的铜板充满你的内心,明天你的内心就可以把你的钱袋注满黄金。
目录
技术元数据:存储位置
业务元数据:字段含义
1.数据仓库构建步骤
1)确定主题:
统计门店销售量
2)确定量度:
量度:表中可以直接找到的字段
KPI:表中不能直接找到 需要统计求出来的
3)确定事实粒度:
最小粒度原则
最小粒度:月
4)确定维度:
维度是要分析的各个角度
站在门店的角度统计销售量的
5)创建事实表:
2.数据仓库建模
1)概念模型
①表达实体
概念模型中不要写外键 在表达关系时会自动表达
②表达关系
一对一 一对多 多对多 多对一
2)物理模型(数据库表)
3.生成库 表 数据
1)创建数据库和表
然后 我们生成数据库语句 放在D盘下 取名为a.sql
打开SQL SERVER 创建一个jtxy_dw数据库 复制a.sql中的代码 点击运行 我们的表就都创建好了
2)生成源数据
打开SQL SERVER 创建一个jtxy_source数据库 复制ERP.sql中的代码 点击运行
3)创建新的Dim_Data表并插入数据
将jtxy_dw中的Dim_Data表删除 使用dim_data.sql中的语句重新创建一下 并使表中有数据 用一个有数据的新表覆盖掉之前没有数据的空表
做到这里 我们的数据仓库就创建好了
4.数据仓库建模模型:维度建模
维度建模:把我们的表分成维度表和事实表
事实表:表中有被统计的列
星模型 雪花模型 星座模型
星模型比雪花模型的查询速度快 在开发中 如果遇到雪花模型 我们通常采用降维度的方法 合并表
合并以后 表就不再遵循三范式了
多个事实表共同关联维度表 形成了星座模型