sqoop将mysql数据导入hive表中时,数据条数不一致

sqoop将mysql数据导入hive表中时,数据条数不一致

问题描述

在使用sqoop将mysql数据导入到hive表中时,发现hive表中对应的数据多了几行null
导致hive表中数据条数与mysql表中数据条数不一致。

问题解决

使用sqoop的命令如下:

sqoop import \
--connect jdbc:mysql://ip:3306/库名 \
--username * \
--password * \
--table * \
--num-mappers 1 \
--fields-terminated-by '\t' \
--delete-target-dir \
--hive-import \
--hive-overwrite \
--hive-database * \
--hive-table * \
--hive-drop-import-delims \
--null-string '\\N' \
--null-non-string '\\N'
  1. 在sqoop命令中加上 - -hive-drop-import-delims \ 即可,作用删除掉mysql中一些特殊字符。
    2.分隔符尽量不要指定为 ‘,’,否则会出现字段数量不一致。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值