概述
- 查询HIVE表分区的数据占用和行数,用于数据治理
- 通常,每天一个分区;
通常,今天查看昨天分区数据量
本文日期分区字段为ymd
创建分区表
-- 创建多级分区表
DROP TABLE IF EXISTS t3;
CREATE TABLE t3 (f1 STRING,f2 INT)
PARTITIONED BY (ymd STRING COMMENT '年月日',h INT COMMENT '时');
-- 插入数据
INSERT INTO TABLE t3 PARTITION(ymd='2022-08-08',h=8)
VALUES ('ef',9),('hh',13);
查看单个HIVE表分区的行数
SELECT COUNT(1) FROM 表 WHERE 分区="分区值";
查看单个HIVE表分区的行数和数据占用
DESC FORMATTED 表 PARTITION(分区="分区值"