hive分桶

5.分桶

分桶意义
–1.提高查询效率。使用链接查询的两个字段进行过分桶。
–2.提高抽样效率
–分桶关键字:bucket

5.1建表语句

怎么知道对那个字段分桶??分几个桶??

create table if not exists tablename(
id int,name string,sex string)
#对性别分两个桶
clustered by (sex) into 2 buckets
row format delimited fields terminated by ' ';

5.2属性

默认属性为true,可以使用分桶,如果不行可更改

set hive.enforce.bucketing=true;

5.3添加数据

表导入

insert into table table1 select * from table2;
#覆盖
insert overwrite table table1 select * from table2;

文件导入

load data local inpath '文件路径' into table tablename;

5.4查询

tablesample (bucket x out of y on gender)
#从y个桶里抽取第x个桶
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值