Hive分区/分桶

本文介绍了Hive中的分区表和分桶表。分区表通过指定分区字段(如国家、日期等)减少全局扫描,提高查询效率。创建分区表后,使用`load data`命令导入数据并进行查询。而分桶表则是根据特定字段将数据分成多个部分,通过哈希函数确定分桶位置,用于优化JOIN查询。创建分桶表时需开启分桶功能,并在导入数据时使用`insert+select`语句。
摘要由CSDN通过智能技术生成

分区表:

  • 创建分区表
create table t_user_partition(id int, name string) partitioned by (country string)  row format delimited fields terminated by ",";
  • 分区表数据导入

    hadoop fs -put 不能导入分区表的数据

  load data local inpath '/root/hivedata/china.txt' into table t_user_partition partition(country ='china');

load data local inpath ‘/root/hivedata/ch

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值