Hive分桶 Hive中的每一个表,每一个分区都可以进行分桶,表或者分区实际上是以文件的形式在hdfs上存储,而分桶物理上相当于将一个文件分成几个文件进行存储,分桶用于大规模数据集。 分桶的使用 1.建表时设置分桶 create table student_bucket(id INT, name STRING, age INT) clustered by (age) into 4 buckets ROW FROMAT DELIMITED FIELDS TERMINA