hive定时清洗至mysql_[数据库到hive增量同步]sqoop定时增量导入mysql数据到hdfs(hive)...

最新推荐文章于 2023-04-14 15:41:03 发布

weixin_39616503

最新推荐文章于 2023-04-14 15:41:03 发布

阅读量257

点赞数

文章标签： hive定时清洗至mysql

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39616503/article/details/114503981

版权

在线QQ客服：1922638

专业的SQL Server、MySQL数据库同步软件需求

有2张大的mysql表，量级分别是1亿和4.5亿(太大了，DBA的同学正在考虑分表)，而且数据是增量的，需要写spark任务做处理，直接读取mysql有点吃力，想通过sqoop定时增量直接导入hive，然后spark sql再与hive交互，能避免mysql的很多瓶颈，研究好几天sqoop定时任务，使用的是sqoop1，版本是sqoop-1.4.6-cdh5.7.0。

1.创建并执行sqoop job:

sqoop job-delete torderincrementjob//先删除之前的job

其中:

–password-file指定hdfs上存放的密码

–fields-terminated-by “\t” \ 指定列分隔符，即制表符

–lines-terminated-by “\n” \ 指定行分隔符，及换行符

–split-by id \ 指定分割的字段

–null-string ‘\N’ \ 指定string类型到hive里的值为NULL

–null-non-string ‘\N’ \ 指定非string类型到hive里的值为NULL

–incremental append

–check-column id

–last-value 1281

<

最低0.47元/天解锁文章

weixin_39616503

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hive定时清洗至mysql_[数据库到hive增量同步]sqoop定时增量导入mysql数据到hdfs(hive)...

在线QQ客服：1922638专业的SQL Server、MySQL数据库同步软件需求有2张大的mysql表，量级分别是1亿和4.5亿(太大了，DBA的同学正在考虑分表)，而且数据是增量的，需要写spark任务做处理，直接读取mysql有点吃力，想通过sqoop定时增量直接导入hive，然后spark sql再与hive交互，能避免mysql的很多瓶颈，研究好几天sqoop定时任务，使用的是sqoo...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。