sqoop从hive导出到mysql数据缺失的解决方法

最新推荐文章于 2024-04-29 11:02:15 发布

总分全班倒数第一

最新推荐文章于 2024-04-29 11:02:15 发布

阅读量3.6k

点赞数 2

分类专栏： sqoop 文章标签： hadoop sqoop mysql 大数据 hive

本文链接：https://blog.csdn.net/weixin_41668549/article/details/88604982

版权

sqoop 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

1，hive创建表的语句

CREATE TABLE `olympic_data`(
  `name` string,
  `age` int,
  `state` string,
  `year` string,
  `date` string,
  `project` string,
  `gold` int,
  `silver` int,
  `bronze` int,
  `total` int)
ROW FORMAT DELIMITED
  FIELDS TERMINATED BY '\t'

2，mysql中创建表的语句：

CREATE TABLE `olympic_data` (
  `name` varchar(20) DEFAULT NULL,
  `age` int(11) DEFAULT NULL,
  `state` varchar(20) DEFAULT NULL,
  `year` varchar(20) DEFAULT NULL,
  `date` varchar(20) DEFAULT NULL,
  `project` varchar(20) DEFAULT NULL,
  `gold` int(11) DEFAULT NULL,
  `silver` int(11) DEFAULT NULL,
  `bronze` int(11) DEFAULT NULL,
  `total` int(11) DEFAULT NULL
)CHARSET=utf8

3，sqoop导出语句：

sqoop export \
--connect jdbc:mysql://master:3306/testdb \
--username hive \
--password 123456 \
--table olympic_data \
--export-dir /user/hive/warehouse/testdb.db/olympic_data/olympic_data.csv \
--fields-terminated-by '\t'

4，结果发现hive中原本有8618条数据，结果导出到mysql中发现数据只有8100条数据，然后我尝试调大map的个数到100，结果还是存在数据丢失。
hive中数据个数：
在这里插入图片描述

mysql中数据个数：
在这里插入图片描述

sqoop export \
--connect jdbc:mysql://master:3306/testdb \
--username hive \
--password 123456 \
--table olympic_data \
--export-dir /user/hive/warehouse/testdb.db/olympic_data/olympic_data.csv \
--fields-terminated-by '\t' \
-m 100

结果还是发现还是只有8100条数据，
5，最后我尝试加了-direct参数，结果发现数据全部导入成功。

sqoop export \
--connect jdbc:mysql://master:3306/testdb \
--username hive \
--password 123456 \
--table olympic_data \
--export-dir /user/hive/warehouse/testdb.db/olympic_data/olympic_data.csv \
--fields-terminated-by '\t' \
-direct

6，最后查了资料说direct参数是一种快速模式，是一种比JDBC更高效的将数据导入到关系型数据库方式。

总分全班倒数第一

关注

2
点赞
踩
14

收藏

觉得还不错? 一键收藏
5
评论
sqoop从hive导出到mysql数据缺失的解决方法

1，hive创建表的语句CREATE TABLE `olympic_data`( `name` string, `age` int, `state` string, `year` string, `date` string, `project` string, `gold` int, `silver` int, `bronze` int, `total` ...
复制链接

扫一扫