数据仓库2_数据建模

0 参考列表

数仓建模—建模流程icon-default.png?t=N7T8https://blog.csdn.net/qq_36039236/article/details/117033210

1 概念

        (1) 数据模型:是抽象描述现实世界的一种工具和方法,通过对实体和实体之间关系的定义和描述,来表达实际业务中具体的业务关系.

        (2) 数据仓库模型:是数据模型中针对数据仓库应用系统的一种特定的数据模型,包含业务模型、领域模型(主题域模型)、逻辑模型、物理模型.

2 主题

2.1 概念

        (1) 主题:在较高层次上将数据进行综合、归类和分析利用的一个抽象概念,每一个主题基本对应一个宏观的分析领域,在逻辑意义上对应企业中某一宏观分析领域所涉及的分析对象.

        (2) 主题域:联系较为紧密的主题的集合.

2.2 划分方法

        (1) 按照业务或者业务过程划分:比如一个靠销售广告位置的门户网站主题域可能会有广告域、客户域等,而广告域可能就会有广告的库存,销售分析、内部投放分析等主题;

        (2) 按照功能或者应用划分:比如微信中的朋友圈数据域、群聊数据域等,而朋友圈数据域可能就会有用户动态信息主题、广告主题等;

        (3) 按照部门划分:比如可能会有运营域、技术域等,运营域中可能会有工资支出分析、活动宣传效果分析等主题.

3 建模方法

3.1 实体建模法

        将整个业务抽象成实体、事件和说明这三部分,理清实体与实体之间的关联.

        ①实体:概念主体,指发生业务关系的对象;

        ②事件:概念主体之间完成一次业务流程的过程,指特定的业务过程;

        ③说明:针对实体和事件的特殊说明.

3.2 范式建模法

        主要解决关系型数据库的数据存储,大部分采用的是三范式建模法.

(1) 特点

        ①数据表多且松散,数据冗余程度低,数据可以灵活应用.

        ②在大规模数据统计分析时,多表关联造成资源消耗大、效率低.

(2) 第三范式的要求

       ①每个属性值唯一,不具有多义性;

       ②每个非主属性必须完全依赖于整个主键,而非主键的一部分;

       ③没有传递依赖.

3.3 维度建模法

        按照事实表和维度表来构建数仓,维度是描述事实的角度,事实是要度量的指标.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值