hive sqoop 分区导入_通过Sqoop向Hive导入ORC表

Sqoop在很长一段时间都只支持导入为textfile、avrofile、sequencefile等格式,如果需要将数据导入为ORC、parquet等格式的Hive Table往往需要分两个步骤完成(先导出临时表,再通过Hive转换)。而从Sqoop 1.4.4开始,Sqoop集成了HCatalog,我们可以轻易地实现多格式支持。

HCatalog配置

Sqoop需要依赖HCatalog的lib,所以需要配置环境变量$HCAT_HOME,一般从hive目录下即可找到hcatalog的相关路径

导入命令

sqoop import

--connect jdbc:mysql://127.0.0.1:3306/test

--username your_user_name --password your_passwd

--table table_name --driver com.mysql.jdbc.Driver

--create-hcatalog-table

--hcatalog-table table_name

--hcatalog-partition-keys month,day

--hcatalog-partition-values 12,09

--hcatalog-storage-stanza 'stored as orc tblproperties ("orc.compress"="SNAPPY")'

参数说明

参数

说明

connect

JDBC连接信息

username

JDBC验证用户名

password

JDBC验证密码

table

要导入的源表名

driver

指定JDBC驱动

create-hcatalog-table

指定需要创建表,若不指定则默认不创建,注意若指定创建的表已存在将会报错

hcatalog-table

要导出的目标表名

hcatalog-storage-stanza

指定存储格式,该参数值会拼接到create table的命令中。默认:stored as rcfile

hcatalog-partition-keys

指定分区字段,多个字段请用逗号隔开(hive-partition-key的加强版)

hcatalog-partition-values

指定分区值,多分区值请用逗号隔开(hive-partition-value的加强)

转载请注明出处:

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值