大数据集群中数据互相导通流程汇总(持续更新中)

X:原理上不存在这种流程或者没有必要。

加粗:数据库或数据仓库

非加粗:表示文件格式

☆:表示重点,正在整理中

左侧列:数据源头

上侧行:数据传递终点

 HbaseHDFSjsontxtMysqlHiveMongodb
HbaseXX(因为hbase本来就是基于HDFS的)[6]或[7][6]或[7][5]
HDFSXX下载后直接转化[3][3]X(因为hive本来就是基于HDFS的) 
json  X直接修改后缀名即可X  
txt   X[3]  
Mysql

[1]或[2]

 X X[4]X
Hive[3]  [3]X 
Mongodb   XX

稍微说明下:

[3]中,把hdfs文件拷贝到本地就是HDFS->txt的过程

hbase->json可以从网上看到都是基于java api读取后处理的。

所以这里“[6]或[7]"是基于python来处理的。

Reference:

[1]sqoop把mysql数据导入hbase-完整记录

[2]NIFI从mysql导入Hbase

[3]把hive数据导出至mysql

[4]sqoop把mysql数据导入hive

[5]hbase映射为hive表(转载+整理+自己验证)

[6]python基于happybase对hbase增删改查-thrift1

[7]python操作hbase配置记录-基于thrift2协议

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值