下载驱动包上传到/opt/cloudera/parcels/CDH-5.12.2-1.cdh5.12.2.p0.4/lib/sqoop/bin
sqoop import
--connect <JDBC连接字符串>
--username <用户名>
--password <密码>
--table <表名>
--target-dir <目标目录>
--columns <字段名> 例如:--columns "name,employee_id,jobtitle"
--where <查询条件> 例如:--where "id > 400"
--query <执行sql查询语句> 例如:--query 'SELECT a.*, b.* FROM a JOIN b on (a.id == b.id) WHERE $CONDITIONS'
双引号查询可能如下所示:--query "SELECT * FROM x WHERE a='foo' AND \$CONDITIONS"
导入数据到HDFS
sqoop import \
--connect 'jdbc:sqlserver://ip:port;database=test;username=sa;password=password' \
--table table1 \
--target-dir /tmp/dbo/table1 \
--num-mappers 1 \
--fields-terminated-by "\t"
导入数据到hive,默认导入的地址是:/user/hive/warehouse
sqoop import \
--connect 'jdbc:sqlserver://ip:port;database=test;username=sa;password=password' \
--table table1 \
--num-mappers 1 \
--hive-import \
--fields-terminated-by "\t" \
--hive-overwrite \
--hive-table table1_hive
从HIVE/HDFS 导出数据
sqoop export \
--connect 'jdbc:sqlserver://1ip:port;database=test;username=sa;password=password' \
--table table2 \
--export-dir /user/hive/warehouse/table1_hive \
--input-fields-terminated-by "\t"
执行脚本
sqoop --options-file <脚本地址>