大数据笔试真题集锦---第十一章:Sqoop面试题

本文聚焦于Sqoop在大数据环境中的应用,详细介绍了如何使用sqoop将数据导入Hive,包括通过hcatalog的便捷方式以及直接从hdfs到hive的流程。同时,也探讨了sqoop将数据导出到MySQL的场景。重点覆盖了1.4.6版本的特性,此版本广泛应用于CDH集成。
摘要由CSDN通过智能技术生成

第十一章目录

第十一章 Sqoop

sqoop本质是一款使用MR进行数据迁移的工具。

目前业界普遍用1.4.6版本,该版本与CDH集成。

hive对外的一个统一存储格式的接口,使用hcatalog对接到hive的数据不需要担心数据在hive中的存储格式和存储位置。sqoop在1.4.4版本后集成了HCatalog

11.1 sqoop导入数据到hive

11.1.1 sqoop+hcatalog

  #使用建表的方式增量导入hive orc;
  #如果已经使用hcatalog,则hive-import系列的指定全都不能用,否则报错;
  和--hcatalog-storage-stanza,存储格式和压缩格式会自动对齐hive表的配置
  sqoop import 
  --connect jdbc:mysql://127.0.0.1:3306/test 
  --username your_user_name --password 123456
  --table table_name --driver com.mysql.jdbc.Driver 
  #用sql语句只支持简单查询,使用子查询或连接查询可能查出错误结果;如果指定-split by,必须使用$CONDITIONS关键字,双引号的查询语句还要加\
  --query "SELECT a.*, b.* FROM a JOIN b on (a.id == b.id) WHERE \$CONDITIONS" \
  ​
  #hcatalog
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值