Hive（6）分桶表

最新推荐文章于 2024-02-25 14:16:39 发布

刚哥的大数据之路

最新推荐文章于 2024-02-25 14:16:39 发布

阅读量204

点赞数

文章标签： hive

本文链接：https://blog.csdn.net/qq_43508211/article/details/108154889

版权

分桶表

将数据分文件存储 , 类似于分区
uid name
1001 ss1
1002 ss2
1003 ss3
1004 ss4
1005 ss5
1006 ss6
1007 ss7
1008 ss8
1009 ss9
1010 ss10
1011 ss11
1012 ss12
1013 ss13
1014 ss14
1015 ss15
1016 ss16

clustered by(uid) – 分桶语法
1 创建分桶表
create table if not exists tb_cluster(
uid int ,
name string
)
clustered by(uid)
into 4 buckets
row format delimited fields terminated by “\t” ;
desc formatted tb_cluster ;

2 创建普通表导入数据到普通表中

create table if not exists tb_cluster2(
uid int ,
name string
)
row format delimited fields terminated by “\t” ;
load data local inpath “/hive/data/cluster.txt” into table tb_cluster2 ;
±-----------------±------------------+
| tb_cluster2.uid | tb_cluster2.name |
±-----------------±------------------+
| 1001 | ss1 |
| 1002 | ss2 |
| 1003 | ss3 |
| 1004 | ss4 |
| 1005 | ss5 |
| 1006 | ss6 |
| 1007 | ss7 |
| 1008 | ss8 |
| 1009 | ss9 |
| 1010 | ss10 |
| 1011 | ss11 |
| 1012 | ss12 |
| 1013 | ss13 |
| 1014 | ss14 |
| 1015 | ss15 |
| 1016 | ss16 |
±-----------------±------------------+