数据仓库(数仓)
文章平均质量分 68
数据仓库(DataWarehouse),一般缩写成DW、DWH。数据仓库是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策
Dear丶TanTaiJin
这是一群注定要用代码改变世界的人啊!
展开
-
数仓的基本理论
1.什么是数据仓库数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它出于分析性报告和决策支持目的而创建。为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。2.数据仓库能干什么年度销售目标的指定,需要根据以往的历史报表进行决策,不能拍脑袋。如何优化业务流程例如:一个电商网站订单的完成包括:浏览、下单、支付、物流,其中物流环节可能和中通、申通、韵达等快递公司合作。快递公司每派原创 2021-04-20 16:52:27 · 2090 阅读 · 0 评论 -
数据模型优化(如何判断一个数据模型的好坏)
数仓模型优化(如何判断一个数据模型的好坏)1.完善度汇总数据能直接满足多少查询需求,即应用层访问汇总层数据的查询比例跨层引用率:ODS层直接被DWS/ADS/DM层引用的表,占所有ODS层表比例可以快速响应业务方的需求比较好的模型,使用方式是可以直接从该模型获取所有想要的数据的,如果DWS,ADS,DM层直接引用ODS层的表比例太大,即跨层引用率太高,则该模型不是最优,可以继续优化2.复用度模型引用系数:模型被读取并产出下游模型的平均数量3.规范度主题域归属分层信息脚原创 2021-04-20 11:29:23 · 1672 阅读 · 0 评论