关于sqoop job免密导出mysql数据

最新推荐文章于 2022-04-29 15:17:25 发布

绿色的血

最新推荐文章于 2022-04-29 15:17:25 发布

阅读量376

点赞数 1

本文链接：https://blog.csdn.net/weixin_43867817/article/details/86683276

版权

sqoop 同时被 2 个专栏收录

1 篇文章 0 订阅

订阅专栏

mysql

1 篇文章 0 订阅

订阅专栏

一、介绍

我在这里阐述一下自己对sqoop job的简答理解：创建sqoop job可以将原来的sqoop提交作业代码固化，只需要创建一次，不需要每次运行时都输入过长的代码，便于重复地调用。

二、前提条件

我进行测试用的sqoop是1.4.7版本的。（这里特别提一下：1.4.6版本的可能不支持增量的导入一些功能）配置了hadoop 2.3.0版本的集群。

三、配置

1. 在sqoop的conf目录下修改sqoop-site.xml文件

文件内容添加以下内容：
<property> 
	<name>sqoop.metastore.client.record.password</name
	<value>true</value> 
	<description>If true, allow saved passwords in the metastore.</description> 
</property>

2. 编写mysql的密码文件，并上传到hdfs上

在liunx本地创建mysql密码文件：
#echo –n “Root123@” > sqoop.pwd
注意：文件个是必须正确。
上传密码文件到hdfs上：
#hdfs dfs –put sqoop.pwd /sqoop/
将hdfs上的密码文件设置权限为400，必须为400:
hdfs dfs –chmod 400 /sqoop/sqoop.pwd
确定是否设置权限成功：
#hdfs dfs –ls /sqoop/sqoop.pwd

四、常用的sqoop job命令

1. 创建sqoop job任务

这里使用–password-file代替–password就是读取之前上传到hdfs上的密码文件来连接mysql。

sqoop job --create sqoopJobName -- import \ 
--connect jdbc:mysql://bigdata1:3306/*?useCursorFetch=true \ 
--username root \ 
--password-file /sqoop/sqoop.pwd \ 
--target-dir /mysqldb/t_order \ 
--table t_order \ 
--fields-terminated-by "\001" \ 
--incremental append \ 
--check-column id \ 
--last-value 0 \ 
-m 1

扩展：上面代码使用的是增量导入，使用sqoop job这种方法，在进行增量导入后就会记忆你的last-value的值，这样你下次运行时就不需要手动更新last-value的值。