相关知识
为了完成本关任务,你需要掌握: 1、Sqoop 导入( import )的基本参数。 2、配置环境。 注意:本关实训 Sqoop 的安装与配置建立在 Hadoop 、 Hive 、 MySQL 已安装配置好的情况下。
Sqoop 的基本参数
Sqoop 能够让 Hadoop 上的 HDFS 和 Hive 跟关系型数据库之间进行数据导入与导出,多亏了import
和export
这两个工具。本实训主要是针对import
(导入)来讲。 现如今我们一直储放数据都是在关系数据库中,但是数据量到达一定的规模后,我们需要数据清理加分析,如果使用关系数据库我们工作量会大大提高,这个时候我们就可以将数据从关系数据库导入(import
)到Hadoop平台上进行处理。
我们要学 Sqoop 的导入也必须先知道里面的基本参数。
输入sqoop help import
可以查看里面参数含义,但是是英文,接下来选取几个常见的参数来分析:
选项 | 含义说明 |
---|---|
--connect <jdbc-uri> |
指定JDBC连接字符串 |
--driver <class-name> |
指定要使用的JDBC驱动程序类 |
--hadoop-mapred-home <dir> |
指定$HADOOP_MAPRED_HOME路径 |
-P | 从控制台读取输入的密码 |
--userna |