Sqoop导入导出操作及参数配置

最新推荐文章于 2022-07-28 09:53:56 发布

灰灰灰灰辉

最新推荐文章于 2022-07-28 09:53:56 发布

阅读量920

点赞数

文章标签：大数据 Apache

本文链接：https://blog.csdn.net/weixin_45553860/article/details/102900101

版权

sqoop就是一个能够在关系型数据库和 hadoop 之间实现数据导入导出的工具，关系型数据库数据迁移到hadoop的称为导入，反之为导出。
sqoop底层执行的是 mapreduce中的 mapTask，这是因为它实现数据的迁移，不涉及数据的聚合操作。在导入数据时，mapreduce 程序读取数据库数据使用 DBinputFormat 来实现。在导出数据时，mapreduce 程序将数据写到数据库，使用 DBoutputFormat 来实现。
sqoop的安装步骤包含了（只是一个工具，学习时最好三台机器都安装）：
1. 下载解压，修改 sqoop-env.sh 配置文件。
2. 添加 jdbc 驱动包到 sqoop的 lib 文件夹下。
3. 添加环境变量。
4. 执行 sqoop-version 验证安装结果。

sqoop帮助文档：

sqoop help
sqoop list-databases --help
sqoop list-tables --help
	Common arguments:常见的连接关系数据库属性

sqoop 安装验证

bin/sqoop list-databases \
--connect jdbc:mysql://localhost:3306/ \
--username root --password hadoop

注意事项：命令携带参数必须出现在一行中，若换行就意味着自动提交执行，可通过\表示未结束。

关注