hbase数据导入mysql_【Kettle学习笔记】从Hbase导入数据至Mysql

本文记录了如何使用Kettle工具将Hbase数据导入到MySQL的过程,包括连接Hadoop集群与MySQL,处理Hbase数据的行列变换以适应MySQL的结构,以及最终的数据输出。虽然在连接Hadoop集群时遇到权限问题,但不影响数据读取,可以继续进行数据迁移。

1、连接Hadoop集群与MySQL

1-1 下载当前集群的Hbase配置文件

ffc1252e18127c9208327d66e783f69d.png

1-2 解压改配置文件至cdh510目录下

aee338326638ea5c1c263b2c687cb4b5.png

1-3 修改D:\kettle\data-integration\plugins\pentaho-big-data-plugin下plugin.properties配置

099e1ad6d66cc71d6ba530ba8d42c5d2.png

1-4 在Kettle中配置Hadoop集群

2b32e48f8662248d876ba11fbc17f639.png

72a7f27fc31a5ab9f4616d129529f0a1.png

在测试连接后会发现User Home Directory Access 和 Root Directory Access 是报错的,这个可能是因为我们是在非集群的一台主机上操作Hadoop数据,会导致没有权限向Hbase内写入数据,没有尝试出一个确切的解决方案,但是不影响读取Hbase数据,所以这里暂时不管它。(有知道解决办法的大佬的话,求指导~~)

1-5 连接Mysql数据库

04eb97b26eb54407a75694c81287c885.png

2、Kettle流程

2-1 Hbase数据读取

6c5dde089d10b9497d17e35ae3a2f4f4.png

5dcf1fb72493725b142c005709f68950.png

35c49dd2048d014717c2b9bbb4ddecd9.png

2-2 行列变换

由于Hbase不是关系型数据库,所以我们要将其字段进行行列变换,否则导出数据会如下图所示

5e02a8c93c24edbdf5c9074e8278f04c.png

选中核心对象——转换——列转行

8bfa82a3d341d3484b8e60d972bf237d.png

然后对流中字段进行改名,改成与转出Mysql表对应的字段,PS:此处字段对应要准确

a02805f9d853efffb3a98cdf9e4b1c79.png

2-3 表输出

将数据输出到目标Mysql表内

d59928493583a82eed6338bf4b0c749d.png

2-4 运行结果

3752ab8bca63c3b9544a2534334d69a1.png

PS:摸索学习中,欢迎相互讨论和指导~

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值