kettle利用Hadoop 导入hive库

最新推荐文章于 2023-05-31 14:15:22 发布

对方正在输入中……

最新推荐文章于 2023-05-31 14:15:22 发布

阅读量1.6k

点赞数 3

文章标签： kettle Hadoop hive Hadoop copy fil

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42565178/article/details/84880113

版权

上一篇文章中是根据表输入->表输出我们会发现如果数据量多的话，速度慢到让人吐血的地步。
为了解决这种输出端数据同步瓶颈，在项目中使用了Hadoop File Output组件，流程如下：
一：连接Hadoop配置
点击kettle big data配置文件kettel\plugins\pentaho-big-data-plugin
在这里插入图片描述修改active.hadoop.configuration值为cdh58（对应与下一步hadoop配置文件）
copy集群的配置文件到cdh58下，并覆盖

需要的文件：core-site.xml、hbase-site.xml、mapred-site.xml、yarn-site.xml
二：Hadoop File Output的使用
1.文件 -> 新建 - > 转换 ->主对象树 ->Hadoop clusters ->

最低0.47元/天解锁文章

对方正在输入中……

关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
5
评论
kettle利用Hadoop 导入hive库

上一篇文章中是根据表输入-&amp;gt;表输出我们会发现如果数据量多的话，速度慢到让人吐血的地步。kettle 作为一个 java 的开源 ETL 工具，支持的接入源与输出源很丰富，今天我们做table -&amp;gt;hdfs -&amp;gt;table数据的写入。文件 -&amp;gt; 新建 - &amp;gt; 转换 -&amp;gt;主对象树 -&amp;gt;Hadoop clusters -&amp;gt;
复制链接

扫一扫

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。