sqoop导数据

  • 安装:
    1. tar –xzvf sqoop-1.4.1-cdh4.1.0.tar.gz
    2. add sqljdbc4.jar into /usr/lib/sqoop/lib
    3. 设置PATH
      1. export SQOOP_HOME=/usr/lib/sqoop

      2. export ANT_LIB=/home/op1/jasonliao/apache-ant-1.9.0/lib
      3. export PATH=$PATH:/home/op1/logging/tool/play-1.2.5:$JAVA_HOME/bin:$ANT_HOME/bin:$SQOOP_HOME/bin

  • sqoop导入hbase:

    • 方式一:

                          sqoop import --connect 'jdbc:sqlserver://***;username=***;password=***;database=MrtgTest' \

                           --table=a --columns a,b,c --where "b='f'" --hbase-table test_sqoop --column-family cf --hbase-row-key a -m 1

               这种column指定不是很灵活,不能指定多个column family。

    • 方式二:
    1. Sqoop导出到hdfs:
      1. sqoop import --connect 'jdbc:sqlserver://***;username=***;password=***;database=MrtgTest' --table=a --columns a,b,c --where "b='f'" --target-dir /user/xgliao/output2 -m 1
    2. Importtsv转换成hfile文件:

      1. hadoop jar /usr/lib/hbase/hbase-0.94.2-cdh4.2.0-security.jar importtsv -Dimporttsv.bulk.output=/user/xgliao/hfile/test -Dimporttsv.separator=, -Dimporttsv.timestamp=20130322 -Dimporttsv.columns=HBASE_ROW_KEY,cf:x,cf:y test_sqoop /user/xgliao/output2
    3. Hfile文件导入hbase:
      1. hadoop jar /usr/lib/hbase/hbase-0.94.2-cdh4.2.0-security.jar completebulkload /user/xgliao/hfile/test test_sqoop (要注意生产hdfs文件跟hbase文件是同一目录下面的)

              这种方式步骤比较多,但是比较灵活,导入过程基本不占用hbase资源。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值