Hadoop第十讲

Hadoop与关系数据库交换数据

  1. 文本转换方案(转换为CSV,文本等文件)
  2. 自写Java程序(用JDBC读关系数据库中的数据用Hadoop的API写入)
  3. Sqoop(SQL-to-HDFS工具)
  4. 厂商提供的解决方案
Hadoop-0.20.2下使用Sqoop:
                  
配置文件
                 
Sqoop命令选项
                
从MySQL导入数据的例子
操作之前需要创建一个用户以方便Sqoop使用,有权限对数据库进行处理。
               
导入到Hbase的命令
             
从Oracle导入数据
             
            
Oracle Big Data Conectors
可以将Hadoop中的文件作为外部表,进行直接访问。
Oracle HDFS直接连接器(ODCH)实验
                
实验环境:具体步骤可以搜索相关官方资料
             
应用于Hbase的对接:通过Thrift
Thrift是一个跨语言的服务部署架构。Thrift通过一个中间语言(IDL,接口定义语言)来定义RPC的接口和数据类型,然后通过一个编译器生成不同语言的代码,并有生成的代码负责RPC协议层和传输层的实现。
具体的原理和使用可以参见博客:
1. http://dongxicheng.org/search-engine/thrift-framework-intro/
2. http://dongxicheng.org/search-engine/thrift-guide/

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值