《Hive权威指南》第九章:模式设计
文章目录9 模式设计9.1 按天划分的表9.2 关于分区9.3 唯一键和标准化9.4 同一份数据多种处理9.5 对于每个表的分区9.6 分桶表数据存储9.7 为表增加列9.8 使用列式存储9.8.1 重复数据9.8.2 宽表9.9 (几乎)总是使用压缩9 模式设计hive看上去与实际操作都像一个关系型数据库,但是事实上Hive是反模式。9.1 按天划分的表对于数据集增长很快的情况,可以使用这种方式,在表名中加入一个时间戳,例如upply_2020_05_20、upply_2020_05_21等。当




