工作数据仓库设计要点201805

        数据仓库层级一般可分为:

  1. ods层:称为接口层或近源数据层,表结构与源系统表结构高度相似,通常在ods层主要会做字段的筛选,枚举值转换,编码统一,异常&缺失数据处理等操作。
  2. dw层:称为中间层,按主题建模(域->主题)的明细数据层,数据粒度与ods层一致。
  3. dm层:称为数据集市层,集市层是按照业务主题、分主题构建出来的、面向特定部门或人员的数据集合。

 

        设计的时候要注意一下:

        1.汇总层表的字段,不应该根据报表的需要来建立,应该根据不同维度和不同粒度的数据和不同时间点的数据进行区分。    

        2.表设计的时候:(1).为什么需要这样设计,(2).作用是什么,(3).在整个数据仓库中是模块的数据,什么样的优先级,来源库是那个。这张表为什么不能够跟同样维度的表合并。(如果是因为业务需要看不同跑数据的时间点,也是可以的。)

        3.清单数据中间层,这个事在同一个主题中可重复使用,加工得到不同粒度和维度的汇总层表的。

        4.要知道什么是基础指标,什么是可加和指标和不可加和指标。

        5.开发的时候主要要有数据测试的方法。验证指标需要在同一份源头的数据写一个口径sql得出指标和,最终的rpt表的指标进行比较。

        6.开发主要进行,维度补充,去重,工作日处理,维度关联,agg合并,到处rpt等得到rpt层。

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
数据仓库设计文档是指在构建和维护数据仓库中所编写的一份文档,它包含了数据仓库设计、结构、功能和运行规则等方面的详细描述。 首先,在数据仓库设计文档中,需要明确数据仓库的目标和需求。这包括对数据仓库的目标业务问题的理解,以及对数据源、数据质量和数据处理需求的分析。 接下来,需要对数据仓库的结构进行设计。这包括对数据模型、维度模型和事实表的设计。数据模型是数据仓库的逻辑模型,它描述了数据仓库中的实体、属性和关系。维度模型是一种针对特定问题领域的数据模型,它描述了事实表和维度表之间的关系。事实表是数据仓库中的核心表,它包含了事实数据和与之关联的维度数据。 同时,还需要考虑数据仓库的ETL(提取、转换和加载)过程。在设计文档中,要描述数据仓库中的数据提取逻辑、数据转换规则和数据加载过程,以确保数据能够从源系统中提取到数据仓库中,并进行合适的处理和加载。 此外,在设计文档中,还需要描述数据仓库的查询和报表需求。这包括了对数据仓库的查询接口和查询工具的设计,以及对报表和分析需求的分析和设计。 最后,在设计文档中,还需要考虑数据仓库的安全和权限管理。这包括了对数据仓库的访问权限控制和数据加密等方面的设计。 总而言之,数据仓库设计文档是数据仓库构建和维护的基础,它提供了对数据仓库的整体架构、数据模型、ETL过程、查询和报表需求、安全和权限管理等方面的详细描述和指导,以确保数据仓库能够满足业务需求,并提供高质量的数据支持决策分析。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值