使用sqoop实现关系型数据库、HDFS、Hive之间数据的导入导出

sqoop概述:sqoop为大数据协作框架之一,以hdfs为核心,实现hdfs与关系型数据库之间的导入导出。

以下操作均建立在已配置好Hadoop、sqoop、hive、mysql等环境,已创建好相应表的基础上

1.mysql->hdfs

sqoop import \
--connect  jdbc:mysql://主机名:端口号/db_name\
--username root \
--password 123456 \
--table  table_name \
--num-mappers 1 \
--target-dir  /sqoop \
--delete-target-dir \
--direct \
--fields-terminated-by '\t'

参数解释:
    num-mappers   指定map的个数
    target-dir    指定目标路径
    delete-target-dir     提前删除指定目录
    fields-terminated-by '\t'    指定分隔符

增量导入

append 追加增量
    sqoop import \
    --connect  jdbc:mysql://主机名:端口号/db_name\
    --username root \
    --password 123456 \
    --table  table_name \
    --num-mappers 1 \
    --target-dir  /sqoop \
    --direct \
    --fields-terminated-by '\t' \
    --check-column id \
    --incremental  append \
    --last-value 1

2.hdfs->mysql

sqoop export \
--connect  jdbc:mysql://主机名:端口号/db_name\
--username root \
--password 123456 \
--table  table_name\
--num-mappers 1 \
--export-dir    /hdfs_mysql \
--input-fields-terminated-by '\t'

参数解释:
    num-mappers   指定map的个数
    export-dir    指定hdfs路径
    input-fields-terminated-by '\t'    指定分隔符

3.mysql->hive

sqoop import \
--connect  jdbc:mysql://主机名:端口号/db_name\
--username root \
--password 123456 \
--table  table_name \
--num-mappers 1 \
--hive-import \
--delete-target-dir \
--hive-database  hive数据库名\
--hive-table  hive中对应的table_name \
--direct \
--fields-terminated-by '\t'

参数解释:
        num-mappers   指定map的个数
        delete-target-dir  提前删除指定目录
        hive-database    hive数据库名
        hive-table     hive数据库中表名
        fields-terminated-by '\t'    指定分隔符

4.hive->mysql

sqoop export \
--connect  jdbc:mysql://主机名:端口号/db_name\
--username root \
--password 123456 \
--table  table_name \
--num-mappers 1 \
--export-dir    /user/hive/warehouse/数据库名/表名 \
--input-fields-terminated-by '\t'

参数解释:
        num-mappers   指定map的个数
        export-dir    指定hive数据库对应的hdfs路径
        input-fields-terminated-by '\t'    指定分隔符

5.hdfs->Oracle

sqoop export \
--connect  jdbc:oracle:thin:@主机名:端口号:ora11g \
--username root\
--password 123456 \
--table  LIVE_VIEWER_SHIP \
--num-mappers 1 \
--export-dir    /user/cxfgs/c3/output/liveRatings/2017/04/30/ \
--input-fields-terminated-by '|'
参数解释:
        num-mappers   指定map的个数
        export-dir    指定hive数据库对应的hdfs路径
        input-fields-terminated-by '\t'    指定分隔符

6.oracle->hive

sqoop import \
--connect  jdbc:oracle:thin:@主机名:端口号:ora11g \
--username root \
--password 123456 \
--table  table_name \
--num-mappers 1 \
--hive-import \
--delete-target-dir \
--hive-database  hive数据库名\
--hive-table  hive中对应的table_name \
--direct \
--fields-terminated-by '\t'

参数解释:
        num-mappers   指定map的个数
        delete-target-dir  提前删除指定目录
        hive-database    hive数据库名
        hive-table     hive数据库中表名
        fields-terminated-by '\t'    指定分隔符
  • 1
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

泪痕残

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值