Hive归档分区表

背景

Hive可以把分区表的分区归档成HAR文件,也可以把归档完的分区进行解压。

以下步骤基于Hadoop2.8.5和Hive2.3.5

步骤

1、把hadoopHome/share/hadoop/tools/lib/hadoop-archives-2.8.5.jar放到hiveHome/lib目录下

2、在hiveHome/conf/hive-site.xml中使能分区归档

  <property>
    <name>hive.archive.enabled</name>
    <value>true</value>
  </property>

3、对于某个分区表,分区归档命令如下

alter table employees archive partition(country='US');

然后可以在hive中查看压缩结果

dfs -ls  /user/hive/warehouse/employees/country=US

结果如下,可以看到在分区目录下生成了data.har文件,就是归档文件

 4、对于归档后的分区表,解压的命令如下所示

alter table employees unarchive partition(country='US');

然后可以在hive中查看压缩结果

dfs -ls  /user/hive/warehouse/employees/country=US

输出如下

结语

关于所需的jar包,《Hive编程指南》中说的是hadoop-a.b.c-tools.jar,可能我用的hadoop版本比较新,所以我的HadoopHome下没有这个jar包,用网上下载的还会报错。最后,我发现我的HadoopHome下直接有归档相关的jar包hadoop-archives-2.8.5.jar,把它放到hiveHome的lib目录下,重启hive客户端就不会有错了。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值