Sqoop教程（二）使用Sqoop在MySQL与Hive之间进行数据导入导出操作

Java朱老师

已于 2022-05-23 09:26:49 修改

阅读量1.6k

点赞数 4

分类专栏： Sqoop 文章标签： hive mysql sqoop

于 2022-05-11 21:30:00 首次发布

本文链接：https://blog.csdn.net/godblessyouandme/article/details/124691649

版权

Sqoop 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

Sqoop主要作用是提供方便的Hive表和关系型数据库表的数据的导入导出操作。
运行Sqoop需要启动Hadoop、Hive服务
在hp1的MySQL中新建数据库test_sqoop，并建表student：
表结构：
在这里插入图片描述
表数据：

导入：

根据MySQL中student表结构，直接在Hive中建立一张表student_h：

sqoop create-hive-table -connect jdbc:mysql://hp1:3306/test_sqoop -table student -username root -password Hive123+ -hive-table student_h

在beeline中查看表结构：

desc student_h

在这里插入图片描述
将MySQL中student表数据，导入到Hive的student_h表中：

sqoop import -connect "jdbc:mysql://hp1:3306/test_sqoop?characterEncoding=utf-8&useSSL=false" -table student -username root -password Hive123+ -hive-import -hive-table my_db.student_x -m 1

其中最后的-m 1，是指开一个任务，以为开启认为会随机在datanode结点上开启，所以要使用hp1指定数据库地址。

如果报异常：

ERROR tool.ImportTool: Import failed: org.apache.hadoop.mapred.FileAlreadyExistsException: Output directory hdfs://hp1:9000/user/root/student already exists

可以先删除掉hdfs上对应的目录：

hdfs dfs -rm -r /user/root/student

重新执行导入命令即可。

以上import语句，在发现没有表的情况下可以自动建表， my_db.student_x语法可以指定Hive的具体数据库。

导出：

在hive中新建表stu_m，导入数据，请参考：
Hive3详细教程（五）内部表、外部表与导入数据
在Mysql的test_sqoop库中新建表studet_e，表结构与hive中保持一致:
在这里插入图片描述

导出语句：

sqoop export -connect  "jdbc:mysql://hp1:3306/test_sqoop?characterEncoding=utf-8&useSSL=false" -username root -password Hive123+ -table student_e -fields-terminated-by ',' --export-dir "/user/hive/warehouse/stu_m"

Java朱老师

关注

4
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Sqoop教程（二）使用Sqoop在MySQL与Hive之间进行数据导入导出操作

Sqoop主要作用是提供方便的Hive表和关系型数据库表的数据的导入导出操作。运行Sqoop需要启动Hadoop在hp1的MySQL中新建数据库test_sqoop，并建表student：表结构：表数据：根据MySQL中student表结构，直接在Hive中建立一张表student_h：sqoop create-hive-table -connect jdbc:mysql://localhost:3306/test_sqoop -table student -username root -p
复制链接

扫一扫

专栏目录