sqoop全量导入与增量导入sqlserver数据

最新推荐文章于 2022-11-24 17:22:41 发布

鲁边

最新推荐文章于 2022-11-24 17:22:41 发布

阅读量1.7k

点赞数

分类专栏： Hadoop sqoop

本文为博主原创文章，转载请注明出处。

本文链接：https://blog.csdn.net/weixin_39836604/article/details/80280662

版权

Hadoop 同时被 2 个专栏收录

9 篇文章 0 订阅

订阅专栏

sqoop

4 篇文章 0 订阅

订阅专栏

sqoop全量导入与增量导入sqlserver数据
1.全量导入
正常导入即可
2.增量导入
sqoop支持两种增量导入到hive的模式，一种是 append，即通过指定一个递增的列,(如果没有可以插入一列自增的数)比如：
--incremental append --check-column id --last-value 0
另一种是可以根据时间戳，比如：
--incremental lastmodified --check-column time --last-value '2018-01-01 11:0:00'
就是只导入time(时间戳字段)比'2018-01-01 11:0:00'更大的数据。

bin/sqoop import \
--connect 'jdbc:sqlserver://xx.xx.xx.xxx:1433;database=库名' \
--username 'root' \
--password 'root' \
--table 'bbb' \
--split-by ResponseTime
--target-dir /user/bbb \
--incremental append \
--check-column num \
--last-value 201805081
#插入该值以后的数据
--check-column WorkNo #指定字段为num