SQOOP增量抽取

本文介绍了如何使用SQOOP将MySQL的数据增量抽取到Hive中,并展示了创建外部表的步骤,以及如何创建和使用SQOOP job来管理增量同步任务,避免手动管理--last-value,确保数据不重复。
摘要由CSDN通过智能技术生成

1.在hive中创建一个外部表进行数据测试:

CREATE EXTERNAL TABLE smes_source.test_etl (
    id int ,
name varchar(8),
score int
)
row format delimited fields terminated by '\001'
lines terminated by '\n' 
stored as textfile

location "/data/cdh/hive/hiveExternal/TEST_ETL";

2.将mysql中现有的数据抽取到hive中

sqoop  import --connect jdbc:mysql://10.96.3.8:3306/lOT_DMPS --username galera --password 123456  --table test_etl --target-dir '/data/cdh/hive/hiveExternal/TEST_ETL' --check-column id --incremental append --last-value 1 --null-string '\\N' --null-non-string '\\N' --fields-terminated-by '\001' --lines-terminated-by '\n' -m 1

3.创建sqoop job:

在进行关系型数据库与Hadoop/Hive数据同步的时候,如果使用--incremental选项,如使用append模式,我们需要记录一个--last-value的值,如果每次执行同步脚本的时候,都需

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值