sqoop导入数据到hive已存的ORC表

飞天小老头

已于 2022-08-03 09:54:30 修改

阅读量1.3k

点赞数

文章标签： hive sqoop hadoop

于 2022-07-28 16:23:34 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/AnameJL/article/details/126037493

版权

业务需求:sqoop从mysql导入数据到hive的orc表
脚本内容如下:

#!/bin/bash
sqoop import \
"-Dorg.apache.sqoop.splitter.allow_text_splitter=true" \
--connect jdbc:mysql://hdp1.jin:3306/db_test \
--username root \
--password hadoop \
--table t_user \
--hcatalog-database db_tmptable \ #直接加上库名和表名即可
--hcatalog-table t_user_tmp \
--null-string '\\N' \
--null-non-string '\\N' \
-m1

这样就可以将数据导入到hive的orc表.

业务需求二:将数据以全量形式导入到hive的orc格式动态分区表
脚本内容如下:

#!/bin/bash
sqoop import \
"-Dorg.apache.sqoop.splitter.allow_text_splitter=true" \
--connect jdbc:mysql://hdp1.jin:3306/db_test \
--username root \
--password hadoop \
--table t_user \
--drop-and-create-hcatalog-table \ #如果表存在就删除,保证数据不会重复
--hcatalog-table t_user_tmp \
--hcatalog-database db_tmptable
--hcatalog-storage-stanza 'stored as orc tblproperties ("orc.compress"="SNAPPY")'
--null-string '\\N' \
--null-non-string '\\N' \
-m1
hive <<EOF
INSERT OVERWRITE TABLE db_test.t_user #t_user动态分区表
SELECT * FROM db_tmptable.t_user_tmp;
EOF
exit;

飞天小老头

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

飞天小老头 CSDN认证博客专家 CSDN认证企业博客

码龄7年

145: 原创

4万+: 周排名

18万+: 总排名

35万+: 访问

: 等级

2341: 积分

131: 粉丝

212: 获赞

129: 评论

650: 收藏

私信

关注

热门文章

分类专栏

HADOOP 18篇
HIVE 11篇
JAVA 8篇
FLink 29篇
OTHER 5篇
Redis 1篇
Linux 3篇
SPARK 13篇
KAFKA 6篇
Mysql 5篇
Doris 3篇
PowerDesigner 1篇
SQL Server 1篇
HBASE 3篇
KETTLE笔记 25篇
达梦数据库 4篇
SCALA 6篇

最新评论

Hdfs的Java客户端API简单使用
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)增加条理清晰的目录；(3)提升标题与正文的相关性。
Ambari-2.7.4和HDP-3.1.4安装(附Ambari和HDP安装包)
九点就要睡觉: 谢谢大佬！安装成功了！~
Ambari-2.7.4和HDP-3.1.4安装(附Ambari和HDP安装包)
想你的夜耶耶: [root@hdp1 ~]# ambari-server start Using python /usr/bin/python Starting ambari-server Ambari Server running with administrator privileges. Organizing resource files at /var/lib/ambari-server/resources... Ambari database consistency check started... Server PID at: /var/run/ambari-server/ambari-server.pid Server out at: /var/log/ambari-server/ambari-server.out Server log at: /var/log/ambari-server/ambari-server.log Waiting for server start.......................................ERROR: Exiting with exit code -1. REASON: Ambari Server java process has stopped. Please check the logs for more information. 这最后一步老是报这个
注册表中exe被删除后恢复
Linsining: 大佬如果显示这个是修复不成功吗 C:\Users\22297\Documents\1.reg 指定路径不存在。请检查路径，然后再试一次。
注册表中exe被删除后恢复
飞天小老头: 存哪里都行，运行的时候选择管理员运行就好了（右键->管理员运行）

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。