ETL中Kettle上连接虚拟机HDFS,同时连接虚拟机MySQL，同步数据到HDSF

星员

于 2024-06-16 18:41:08 发布

阅读量416

点赞数 9

分类专栏： ETL 文章标签： hdfs mysql hadoop etl

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_64144926/article/details/139724030

版权

ETL 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

第一步：替换文件如下图需替换4个文件：

在替换之前先打开plugin.properties进行赋值如下图：

先把目录下需要替换的文件进行删除如下图：

第二步：把文件复制在目标目录下去第一个文件如下：

如下已经复制成功第一个：

接下来复制mapred-site.xml文件和yarn-site.xml文件如下图：

如图三个文件替换完成：

第三步：启动Hadoop集群，再启动kettle：

输入./spoon.sh启动kettle：

找到BigData，把Hadoop File OutPut拖动出来：

这里可以看出kettle启动成功

把Hadoop File OutPut拖动出来成功如下图：

第四步：配置Hadoop File OutPut，Hostname:HadoopMaster,Port:9000，配置如下图：

这里备注一点：在虚拟机中如果没有给虚拟机中的MySQL赋权，那么要在虚拟机中的MySQL中输入，MySQL的驱动安装在下面说明，如下指令：

GRANT ALL PRIVILEGES ON *.* TO 'root'@'HadoopMaster' IDENTIFIED BY 'your_password' WITH GRANT OPTION;这里your_password改为自己的密码
FLUSH PRIVILEGES;

这里可以得出与Hadoop连接成功：

这里我选择的是hdfs下的mydata,当转换运行成功后会生成一个mydata.txt文件，如下图配置：

第五步：表输入，把表输入拖进去：

表输入拖入完成后，去Linux中的MySQL中查看数据库如下图：

接下来就要配置输入表，主机名是：HadoopMaster数据库：hive01,如下图：

点击测试表示数据库连接正确，这里如果报错，问题可能是存在kettle中没有MySQL的驱动，需要把MySQL的驱动放入到data-integration目录下lib目录中，然后重新启动：

这里是验证表输入的连接，选择预览即可看见hive01数据库中table01表的数据：

第六步：先保存转换，再启动转换，如下图可以看出启动成功，输入10，输出10，报错为0，说明转换成功：

接下来去到hdfs下查看是否生成mydata.txt文件，如图可以看到已经生成这个文件：

接下来打开mydata.txt文件，如图文件内容正确，说明实验成功，kettle连接HDFS成功，数据同步成功：

关注

9
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
ETL中Kettle上连接虚拟机HDFS,同时连接虚拟机MySQL，同步数据到HDSF

虚拟机中ETL中kettle连接HDFS，kettle连接MySQL数据同步HDFS，解决驱动问题，kettle连接MySQL授权问题。
复制链接

扫一扫

专栏目录

星员 CSDN认证博客专家 CSDN认证企业博客

码龄3年

1: 原创

173万+: 周排名

22万+: 总排名

416: 访问

: 等级

19: 积分

11: 粉丝

9: 获赞

1: 评论

6: 收藏

私信

关注

热门文章

ETL中Kettle上连接虚拟机HDFS,同时连接虚拟机MySQL，同步数据到HDSF 416

分类专栏

ETL 1篇

最新评论

ETL中Kettle上连接虚拟机HDFS,同时连接虚拟机MySQL，同步数据到HDSF
CSDN-Ada助手: MySQL入门技能树或许可以帮到你：https://edu.csdn.net/skill/mysql?utm_source=AI_act_mysql
ETL中Kettle上连接虚拟机HDFS,同时连接虚拟机MySQL，同步数据到HDSF
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天最佳新人】榜单，全部的排名请看 https://bbs.csdn.net/topics/619014799。

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。