hive中分桶、视图、侧视图的用法

最新推荐文章于 2024-04-14 01:50:08 发布

Mr.梧桐

最新推荐文章于 2024-04-14 01:50:08 发布

阅读量410

点赞数

文章标签： hive 大数据

本文链接：https://blog.csdn.net/weixin_49165958/article/details/110951491

版权

目录1.分桶2.视图3.侧视图（lateral view）1.分桶首先明确一点：分区对应的是文件夹分桶对应的是文件分桶对应于HDFS中的文件更高的查询处理效率使抽样（sampling）更高效根据“桶列”的哈希函数将数据进行分桶1.创建一个分桶表，关键字是clusteredcreate table if not exists hr_bucket(name string,id int,num string,time2 string )clustered by (id) int

摘要由CSDN通过智能技术生成

1.分桶

首先明确一点：
分区对应的是文件夹
分桶对应的是文件
分桶对应于HDFS中的文件

更高的查询处理效率
使抽样（sampling）更高效
根据“桶列”的哈希函数将数据进行分桶

1.创建一个分桶表，关键字是clustered

create table if not exists hr_bucket(
name string,
id int,
num string,
time2 string 
)
clustered by (id) into 8 buckets
row format delimited
fields terminated by '|'

最低0.47元/天解锁文章

Mr.梧桐

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
hive中分桶、视图、侧视图的用法

目录1.分桶2.视图3.侧视图（lateral view）1.分桶首先明确一点：分区对应的是文件夹分桶对应的是文件分桶对应于HDFS中的文件更高的查询处理效率使抽样（sampling）更高效根据“桶列”的哈希函数将数据进行分桶1.创建一个分桶表，关键字是clusteredcreate table if not exists hr_bucket(name string,id int,num string,time2 string )clustered by (id) int
复制链接

扫一扫