数仓建模—表设计规范

本文详细介绍了数仓中表的设计规范,包括表的概述、数据类型、表设计目标、影响及步骤。重点讨论了如何降低存储、计算和维护成本,强调了分区设计、数据类型的选取以及表数据存储规范。此外,还提供了表设计最佳实践,如解决小文件问题、维度表和拉链表设计,以及不同类型表的设计策略。
摘要由CSDN通过智能技术生成

数仓建模—表设计规范

前面我们介绍了一些数仓的设计规范,主要围绕着数仓整体的设计以及维度建模来的,你可以参考:

  1. 数仓建模—数仓开发规范
  2. 数仓建模—事实表和维度表设计规范

我们知道数仓本质上是一堆表的集合,所以我们今天就来看一些关于表本身的一些设计问题

表的概述

表本身其实就是一组文件的集合,只不过我们赋予了它结构的概念,最终演化成了数据的组织方式。在整个数仓中从数据源到数据集成再到数据开发以及到最后的数据应用,我们都是通过表来完成的,也就是说我们的整个过程都是围绕着表来的。

我们大致有下面几类表

image-20211216113851067

表(Table)是Hive的数据存储单元。它在逻辑上是由行和列组成的二维结构,每行代表一条记录,每列表示相同数据类型的一个字段。一条记录可以包含一个或多个列

  • 7
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值