数仓模型理论

本文介绍了数据仓库的基本概念,深入探讨了建模理论,包括三范式、ER模型、DataVault模型和维度模型。同时,详细阐述了Hive的技术架构,涉及数据类型、压缩格式、文件格式、内部表与外部表的选择以及优化策略。此外,还提及了HBase的rowkey设计原则。
摘要由CSDN通过智能技术生成

1 数仓介绍

在这里插入图片描述

2 建模理论

建模的目标:性能、成本、效率、数据质量中找到平衡点

2.0 三范式

123要求逐渐严格

  1. 每一列不可分割
  2. 属性要完全依赖于主键,不可以只依赖一部分(数据重复很多)案例中主键是学生id和课程,所属系和系主任只依赖学生id

在这里插入图片描述
3. 主键以外的字段没有依赖关系
在这里插入图片描述

2.1 ER(Entity Relationship)实体模型

在这里插入图片描述
在这里插入图片描述

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值