sqoop hive数据导出分区表到关系型数据库

5 篇文章 0 订阅
3 篇文章 0 订阅

sqoop hive数据导出分区表到关系型数据库

业务场景,某天的结果表数据做报表端的数据展示,hive为分区表,报表数据结果为oracle做结果表输出,发现全量同步可以完成,增量同步不生效,排查sqoop参数发现问题,具体情况举例说明。
(业务库为其他的mysql等可换jdbc连接串)

结果表: 各省截止6点的完成订单数量(每天)
hive表:app.order_info_province_total_di
字段:province,sum_order 分区字段:pt
oracle结果表:同名不同不同库

通过sqoop从hive抽取到oracle

sqoop export \
-Dhadoop.security.credential.provider.path=jecks://hdfs/user/hive/password/app.pwd.jecks
--connect jdbc:oracle:thin:@//192.168.19.188:1521/orcl \
--username order \
--password-alias app.pwd.alias \
--table ORDER_INFO_PROVINCE_TOTAL_DI \
--columns PROVINCE,SUM_ORDER,PT
--hcatalog-database app \
--hcatalog-table order_info_province_total_di \
--hive-partition-key pt \
--hive-partition-value '2023-12-12' \
-m 1;

问题:

1、 hive源表应该为hcatalog可用格式(ORC或者PARQUET),textfile格式不支持。
2、hive-partition-value 分区字段这块要加一下单引号,不要写成 pt=‘2023-12-12’
其余hadoop秘钥生成可以参考我另一篇文章,链接放下面了。

链接: sqoop生成秘钥串

  • 6
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值