目录1.分桶2.视图3.侧视图(lateral view)1.分桶首先明确一点:分区对应的是文件夹分桶对应的是文件分桶对应于HDFS中的文件更高的查询处理效率使抽样(sampling)更高效根据“桶列”的哈希函数将数据进行分桶1.创建一个分桶表,关键字是clusteredcreate table if not exists hr_bucket(name string,id int,num string,time2 string )clustered by (id) int
createtableifnotexists hr_bucket(
name string,
id int,
num string,
time2 string
)clusteredby(id)into8 buckets
row format delimited
fieldsterminatedby'|'
目录1.分桶2.视图3.侧视图(lateral view)1.分桶首先明确一点:分区对应的是文件夹分桶对应的是文件分桶对应于HDFS中的文件更高的查询处理效率使抽样(sampling)更高效根据“桶列”的哈希函数将数据进行分桶1.创建一个分桶表,关键字是clusteredcreate table if not exists hr_bucket(name string,id int,num string,time2 string )clustered by (id) int